陈群


的个人主页 http://teacher.nwpu.edu.cn/chenqun

基本信息 The basic information

陈群

计算机学院

博士研究生毕业

工学博士

教授

计算机科学与技术

工作经历 Work Experience

陈群,男,1976年出生,清华大学管理信息系统学士,新加坡国立大学计算机科学博士,现任西北工业大学教授,博士生导师。研究领域为大数据与人工智能。曾获得国家教育部“新世纪优秀人才”和劳动与社会保障部“海外高层次引进人才”称号。计算机学会数据库专家委员会委员,国家自然科学基金委信息学科数据库与大数据领域评审专家,科技部重点研发专项大数据与人工智能领域专家。主持或负责自然科学基金委青年基金项目, 重点项目和国际合作项目;科技部863,973子课题和重点研发专项子课题等国家级课题。在国内外专业权威期刊发表近60篇学术文章,其中近年来多项开创性的研究成果发表在代表领域最高水平的顶级会议和期刊如SIGMOD, VLDB, ICDE, WWW, TKDE, CIKM, ICDM和ICDCS等。



科学研究 Scientific Research

具体的研究工作如下:

 针对深度学习模型的不确定性和不可解释性,近年来从事前沿的人工智能风险分析研究(即对于一个分类问题,分析和评估人工智能算法给予实例错误标签的风险),正在努力把它发展成有战略价值和重要前景的研究方向。在这个方向,相关工作已发表在国际顶级会议和期刊,如ICDE, VLDB Workshop和TKDE。在这个方向上,做了如下具体贡献:(1)不再把一个实例的标签概率用一个单值表示,而是借鉴投资风险分析理论,提出用一个分布(如正态分布)来表示标签概率,以便更准确地刻画其波动风险,为更准确的风险分析打下了坚实的理论基础,并在国际上首次将目标任务命名为风险分析;(2)首次提出风险特征的概念并提出一种基于单边决策树自动生成风险特征的方法;(3)首次提出一个可学习的风险模型,并提出一种针对性的训练方法;(4)首次把风险分析应用于基于人机协作的分类质量控制问题。虽然目前具体的研究工作主要针对实体解析,但我们提出的方法容易被扩展应用于一般性分类问题。另一方面,如果风险分析技术仅仅只能应用于机器标签的风险量化,以及众包或人机协作的质量控制等,顶多只能算一个重要的研究问题。但是,我们提出的风险分析技术提供了一种更准确地度量和评估机器标签不确定性的新方法,潜在地可以深刻影响机器学习的几乎每一个核心环节,如训练数据的选择,模型的选择和训练等。因此,风险分析是一个非常有前景且对人工智能有重要战略价值的研究方向。

 

  与此同时,针对目前深度学习依赖大量人工标注训练数据的问题,正在研究不基于i.i.d假设(即独立同分布假设)的新型机器学习方法,or non-i.i.d learning。在国际上首次提出一种机器学习的新范式,渐进机器学习, gradual machine learning (GML):给定一个分类任务,用机器自动标注一些简单的实例,然后通过因子图推理渐进地标注其他更难的实例。相比于深度学习,渐进机器学习只需要很少甚至不需要人工标注训练数据。我们已经把渐进机器学习成功应用于实体解析和情感分析等分类任务。GML的前序工作已被国际顶级期刊TKDE接收;同时,关于渐进机器学习的开创性文章已发表在国际顶级旗舰会议WWW 2019的Proceedings上。渐进机器学习是近年来开创的另一个非常有前景的研究方向。


学术成果 Academic Achievements

近年来代表性论文:

【1】Boyi Hou, Qun Chen and etc. r-HUMO:A Risk-aware Human-Machine Cooperation Framework for Entity Resolution with Quality Guarantees,IEEE Transactions on Knowledge and Data Engineering,preprint, online available, 2018.

【2】Yanyan Wang, Qun Chen and etc. Joint Inference for Aspect-level Sentiment Analysis by Deep Neural Networks and Linguistic Hints, IEEE Transactions on Knowledge and Data Engineering,preprint, online available, 2019.

【3】Boyi Hou, Qun Chen and etc. Gradual machine learning for entity resolution, Proceedings of the Web Conference (WWW), 2019. 

【4】Zhaoqiang Chen, Qun Chen and etc. Enabling quality control for entity resolution: A human and machine cooperation framework[C]. IEEE 34th International Conference on Data Engineering (ICDE), 2018.

【5】Zhaoqiang Chen, Qun Chen and etc. Improving machine-based entity resolution with limited human effort: A risk perspective, VLDB workshop BIRTE, 2018. 

【6】YanyanWang, Qun Chen and etc. SenHint: A joint framework for aspect-level sentiment analysis by deep neural networks and linguistic hints. The Web Conference 2018 (WWW), 2018.