TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding

本工作被KDD2020 ADS Track接受,相关视频等资料下载 http://web.cs.ucla.edu/~patricia.xiao/timme.html。社交网络上的意识形态分类任务有很广阔的应用场景。本工作从推特(Twitter)数据入手,获取推特数据后拟用图神经网络(graph neural network)解决此问题。主流的图嵌入模型研究仅关注规模小而稀疏,并且标签(label)丰富的数据集,比如学术网络数据。许多真实应用场景,譬如推特这种社交网络数据,规模大且连接稠密,但是标签却异常稀疏。这种大而稠密的数据使得主流嵌入模型效率很低,标签稀疏又非常容易产生过拟合现象。真实场景下的数据还往往具有特征(feature)不完全性和异质性的特点,进而带来更大的挑战。本工作提出了TIMME,一种针对多任务多关系的嵌入模型,利用多种关系类型作为补充来处理规模庞大而标签稀疏的图数据,并且进一步提出了可以使得本模型能在特征缺失的情况下使用不完整的特征进行学习的方法。针对规模大而关系异质的问题,本工作首先采用多关系的图卷积网络对特征进行编码;同时为了解决缺失特征的问题,当特征不完整时,将缺失部分的特征视作可训练的参数。然后采用多任务解码器,让多个任务互相协助,从而解决标签稀疏的问题。代码和数据都已公开https://github.com/PatriciaXiao/TIMME 。

播放:53次,课程ID:5326801

TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding课程简介:前往报名学习

TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding课程简介:

本工作被KDD2020 ADS Track接受,相关视频等资料下载 http://web.cs.ucla.edu/~patricia.xiao/timme.html。社交网络上的意识形态分类任务有很广阔的应用场景。本工作从推特(Twitter)数据入手,获取推特数据后拟用图神经网络(graph neural network)解决此问题。主流的图嵌入模型研究仅关注规模小而稀疏,并且标签(label)丰富的数据集,比如学术网络数据。许多真实应用场景,譬如推特这种社交网络数据,规模大且连接稠密,但是标签却异常稀疏。这种大而稠密的数据使得主流嵌入模型效率很低,标签稀疏又非常容易产生过拟合现象。真实场景下的数据还往往具有特征(feature)不完全性和异质性的特点,进而带来更大的挑战。本工作提出了TIMME,一种针对多任务多关系的嵌入模型,利用多种关系类型作为补充来处理规模庞大而标签稀疏的图数据,并且进一步提出了可以使得本模型能在特征缺失的情况下使用不完整的特征进行学习的方法。针对规模大而关系异质的问题,本工作首先采用多关系的图卷积网络对特征进行编码;同时为了解决缺失特征的问题,当特征不完整时,将缺失部分的特征视作可训练的参数。然后采用多任务解码器,让多个任务互相协助,从而解决标签稀疏的问题。代码和数据都已公开https://github.com/PatriciaXiao/TIMME 。

前往报名学习

TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding课程目录:

No list

No list

TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding授课教师:

肖之屏-UCLA CS 在读博士生-加州大学洛杉矶分校-

UCLA CS 在读博士生, 导师为Prof. Yizhou Sun。当前的主要研究方向为社交网络上的数据挖掘。个人主页http://web.cs.ucla.edu/~patricia.xiao/

© 柠檬大学 2020