English 清华大学 旧版入口 人才招聘

学术报告

汉语文本数据挖掘的统计方法

报告题目:汉语文本数据挖掘的统计方法

报告人:郭建华教授(东北师范大学数学与统计学院、应用统计教育部重点实验室)

时间:2012年5月10日(星期四)16:00-17:00

地点:理科楼数学系A304

摘要:汉语文本的急剧涌现使得其有效处理成为政界、管理学界、信息学界面临的一个极具挑战性的问题。自2005

年5月始,我们与长春市政府市长公开电话办公室长期密切合作,研究电话投诉案例的分类汇集、分析整理工作,以

期找出规律性的问题,并从中发现工作中的薄弱环节,为改进工作、制定决策提供重要依据。为此联合开发了"智能

化综合服务网络"。市长公开电话数据的显著特点是数据量大、数据维度高、数据采集环境复杂、分析目标经常变化

等。这是现代统计学面临的最大挑战。在此数据的驱动下,我们提出了结构降维的策略。用网络表示定性的成分

(可称为结构信息),用分布刻画定量的成分。定性成分的拓扑结构既可以由专业知识来勾画,又可以通过数据来

补充。本报告主要讲述我们利用结构降维策略在特征选择方面取得的一系列新成果。

报告人简介:郭建华

³ 教授、博士生导师、东北师范大学数学与统计学院院长

³ 国务院学位委员会数学学科、统计学科评议组成员

³ 国家杰出青年基金获得者

³ “新世纪百千万人才工程”国家级人选

³ 教育部“长江学者和创新团队发展计划”创新团队带头人

³ 中国数学会常务理事

³ 中国现场统计研究会常务理事

³ 享受国务院政府特殊津贴

³ 曾获国家统计局全国统计科学科技进步奖一等奖、国家教委科技进步奖二等奖、国家教育部自然科学奖二等奖

联系人:杨瑛