ACM西安分会活动-大数据与人工智能研讨会议程

时间:2018-11-07

ACM 中国

Association for Computing Machinery, China

ACM西安

undefined

中国计算机学会(CCF)西安分部、ACM西安联合主办

西北大学 信息科学与技术学院 智能时空数据挖掘实验室 承办

2018528

大数据与人工智能研讨会由中国计算机学会(CCF)西安分部、ACM西安联合主办,西北大学信息科学与技术学院智能时空数据挖掘实验室承办,会议邀请国内数据挖掘领域知名专家分享探讨大数据挖掘与人工智能的前沿技术、趋势与发展。

一、时间地点:

时间:2018528  9:00-16:40

地点:西安市长安区郭杜教育科技产业园区学府大道1号,西北大学长安校区信息学院5层会议室

二、日程安排:


2018528日(星期一)

时间

内容

主持人

地点

9:00-9:10

开幕式

开幕致辞

王欣

教授

信息学院5层会议室

9:10-10:00

学术报告

报告题目:RSP Data Model and Technology for Analysis of Big Data in Terabytes and Beyond

黄哲学教授(深圳大学)

王欣

教授

10:00-10:50

学术报告

报告题目:大数据挖掘的若干模型

张师超教授(中南大学)

陈晓江教授

10:50-11:00

   

11:00-11:50

学术报告

报告题目:Future Large-scale Predictive Data Analytics: Opportunities and Challenges

浣军教授(百度北京大数据实验室)

冯筠

教授

12:00-14:00

14:00-14:50

学术报告

报告题目:基于认知的机器学习公理化

于剑教授(北京交通大学)

王欣

教授

信息学院5层会议室

 

14:50-15:40

学术报告

报告题目:稀疏表示的新模型及其应用

周水庚教授(复旦大学)

管子玉

教授

15:40-15:50

15:50-16:40

学术报告

报告题目:Personalized Travel Route Recommendation Using Collaborative Filtering Based on GPS Trajectories

王欣教授(西北大学、卡尔加里大学)

周水庚教授


 




 

























三、执行主席:王欣    教授   西北大学(陕西省百人计划学者)、加拿大卡尔加里大学。

四、会议秘书与工作人员:曲博婷 许震洲 黄龙飞 边文涛 任鑫宇

会议咨询电话:17788070301 13669285242

五、特邀报告嘉宾简介

undefined

报告题目:RSP Data Model and Technology for Analysis of Big Data in Terabytes and Beyond

嘉宾简介:Dr. Joshua Zhexue Huang is a distinguished professor at College of Computer Science and Software in Shenzhen University. He is the founding director of Big Data Institute of Shenzhen University, and Deputy Director of National Engineering Laboratory for Big Data System Computing Technology. Prof. Huang is known for his contributions to the development of a series of k-means type clustering algorithms in data mining, such as k-modes, fuzzy k-modes, k-prototypes and w-k-means that are widely cited and used, andsome of which have been included in commercial software. He has extensive industry expertise in business intelligence, data mining and big data analysis. He has been involved in numerous consulting projects in Australia, Hong Kong, Taiwan and mainland China. Dr Huang received his PhD degree from the Royal Institute of Technology in Sweden. He has published over 200 research papers in conferences and journals.In 2006, he received the first PAKDD Most Influential Paper Award.He was the program chair of PAKDD 2011, the local organization chair of ICDM 2014 and the conference co-chair of PAKDD 2016.

报告摘要:The big values in big data can only be dug out through deep analysis of data. In the era of big data, datasets with hundreds of millions objects and thousands of features become a phenomenon rather than an exceptional case. Such datasets are often in the size of terabytes and can easily exceed the size of the memory of the cluster system. Current big data analysis technologies are not scalable to such data sets because of the memory limitation. Therefore, effectively processing and analyzing big data in terabytes and beyond is becoming a big challenge.

In this talk, I will present a new approach for big data processing and analysis that is based on the divide-and-conquer strategy and statistical estimation, ensemble learning, approximate and distributed computing. Firstly, I present the RSP data model to represent a big data set as a set of distributed random sample data blocks where each random sample data block is a random sample of the big dataset and it can be used to estimate the statistics of the big dataset and build a classification or prediction model for the big data. Secondly, I introduce an asymptotic ensemble learning framework, named as Alpha Framework that stepwise builds ensemble models from selected random sample data blocks to model the big data. Using this set of new technologies, we are able to analyze big data in terabytes effectively on a small cluster without memory limit. In this new architecture, data analysis engines can be separated from the storage of big data in data centers and analysis of big data cross multiple data centers is made possible.

undefined

报告题目:大数据挖掘的若干模型

嘉宾简介:张师超教授是国家千人计划创新人才第五批特聘专家,长期从事数据挖掘和大数据的研究,在多源数据挖掘、不完全信息挖掘、代价敏感学习和kNN分类等方面取得系列原创性研究成果。在Springer出版学术专著3部,以第一或者通信作者在国际重要学术期刊发表论文80余篇,包括Trans论文20多篇、ESI高引论文3篇。据GoogleScholar检索,成果获得引用总计6000多次,20142017年连续四年进入Elsevier发布的中国高被引学者榜单。现任TKDDIEEE Intelligent Informatics Bulletin的副编辑,曾任TKDEKAIS的副编辑,国际会议ADMA指导委员会委员,以及国际会议的会议主席/程序主席10多次。

报告摘要:本报告介绍五类应用驱动的数据挖掘模型,主要包括大规模数据挖掘、多源数据挖掘、不完全信息挖掘、代价敏感学习和kNN分类方法。在这些模型中自始自终贯穿一个思想:先理解数据,后挖掘数据。有效理解大数据是关键,本报告倡导采用传统的“分而治之”,将数据量大的问题转化成如何有效加权的问题,籍以抛砖引玉。

undefined

报告题目:Future Large-scale Predictive Data Analytics:Opportunities and Challenges

嘉宾简介:浣军,  现任百度北京大数据实验室主任。 回国前担任美国堪萨斯大学(University of Kansas)电子工程和计算机系Spahr讲席终身职正教授、博士生导师和美国国家科学基金委项目主任,主管大数据。浣军教授长期从事大数据、 AI、数据挖掘和机器学习的理论、算法和应用的研究。在国际一流学术期刊和顶级国际会议上发表了超过130篇论文。他于2009年获得美国国家科学基金委杰出青年科学基金奖。 他的研究组获得多项最佳论文奖。浣军教授也担任多个美国国家科学基金委、国立卫生研究院大数据、信息与智能系统项目首席研究员。浣军教授担任 IEEE BIBM’15程序委员会主席, ACM KDD’18 Workshop 主席,IEEE ICDM’20 程序委员会主席。 浣军教授也多次担任多个国际会议的领域主席。

报告摘要:人工智能对于当今社会各方面正在发挥巨大影响。 今天AI不仅仅是简单地提高一些行业的效率,而是可以从根本上改变信息、金融、医疗乃至交通、运输等等行业的面貌。某些人类的简单重复性思维(如图像、语音识别),人工智能算法在正确率、持续性和可扩展性上都更具有优势。而从数据上提取更深刻的特征等方面的能力,AI也超过或正在超过人类。此次报告分为两个部分:一、简要介绍一下百度的人工智能方面的一些进展。介绍内容包括NLP,知识图谱,图像,语音相关方向的研发和应用;二、介绍百度大数据实验室对人工智能未来研究的一些预期和正在进行的工作。

undefined

报告题目: 基于认知的机器学习公理化

嘉宾简介:于剑,现任北京交通大学教授,博士生导师,北京交通大学人工智能研究院常务副院长,交通数据分析与挖掘北京市重点实验室主任,中国计算机学会会士、理事,中国计算机学会人工智能与模式识别专业委员会秘书长,中国人工智能学会理事,中国人工智能学会机器学习专业委员会副主任,主持多项国家自然科学基金项目。主要研究兴趣是机器学习、数据挖掘和自然语言处理等。

报告摘要:在大数据时代,因应用需求的驱动,大量新机器学习方法不断产生。 这些新算法理论依据各异,彼此之间的关系极其复杂,对学习算法的使用者要求极高。但是, 儿童的学习能力虽高, 却不能掌握现今机器学习的理论。 是否能够提出一套符合人类认知的机器学习理论,是当前一个亟待解决的问题。本次报告试图提出一个统一基于认知的机器学习公理化框架,  其基本假设是: 归哪类,像哪类;像哪类,归哪类。该机器学习理论可以推演出归类方法的三条设计原则, 以统一的方式重新解释了数据降维、密度估计、回归,聚类和分类等问题,而且与日常生活中的认知原则一致。

undefined

报告题目:稀疏表示的新模型及其应用

嘉宾简介:周水庚,复旦大学计算机学院教授/博士生导师,上海市智能信息处理重点实验室副主任。主要研究领域为人工智能、大数据管理与分析、生物信息学等。在相关国际学术期刊(包括VLDB Journal, IEEE TKDE, IEEE TGRS, IEEE TPDS, IEEE/ACM TCCB, Nature Communications, Nucleic Acids ResearchBioinformatics等)和国际学术会议(包括SIGMODSIGKDDVLDBICDE, AAAI, IJCAIICCV,CVPR, SODA, ECML, ECAI, EDBTRECOMBISMB等)发表研究论文200多篇;获教育部自然科学二等奖1项、教育部科技进步二等奖2项。目前为中国计算机学会理事、杰出会员,中国计算机学会生物信息学专业组主任委员、数据库专委会委员和大数据专家委员会委员等。

报告摘要:稀疏表示是一种寻找样本间稀疏关系的机器学习方法。近年来,我们提出了多种结构化稀疏表示的新模型,并运用于一些生物数据挖掘问题,包括蛋白质功能预测、药物-蛋白质相互作用预测等。本报告在简单介绍稀疏表示的基本概念和模型的基础上,重点介绍我们的新模型和这些模型应用于生物数据挖掘中所取得的结果。

六、执行主席介绍

undefined

王欣,加拿大卡尔加里大学终身教授、博士生导师,GIS学科带头人,加拿大人工智能委员会执行委员,陕西省百人计划学者。王欣教授长期从事空间数据挖掘及人工智能等方面的科学研究与教学工作,发表学术论文80余篇,获得加拿大阿尔伯特省科研奖励1项,主持加拿大自然科学与工程技术等研究项目26项,主持和参与中国国家自然科学基金和陕西省国际科技合作与交流计划项目共5项。王欣教授曾担任第1届(香港),第2届(韩国斧山)空间信息管理与数据挖掘国际合作工作组 (SIM3)主席,第12届国际Web及无线GIS国际会议主席 (W2GIS),第17届亚太知识发现与数据挖掘国际会议组织委员会委员 (PAKDD),及第3届和第4IEEE数据科学和分析国际会议(DSAA)组织委员会委员。并多次在各种国际会议上做主题报告。

报告题目:Personalized Travel Route Recommendation Using Collaborative Filtering Based on GPS Trajectories

报告摘要:A personalized travel route recommendation refers to plan an optimal travel route between two geographical locations, based on the road networks and users’ travel preferences. In the second application, I will first define users’ travel behaviors from their historical Global Positioning System (GPS) trajectories and present two personalized travel route recommendation methods­ – CTRR and CTRR+. Both methods consider users’ personal travel preferences based on their historical GPS trajectories. In this paper, we first estimate users’ travel behavior frequencies by using collaborative filtering technique.  A route with the maximum probability of a user’s travel behavior is then generated based on the naïve Bayes model. The CTRR+ method improves the performances of CTRR by taking into account cold start users and integrating distance with the user travel behavior probability. This talk also presents some case studies based on a real GPS trajectory dataset from Beijing, China. The experimental results show that the proposed CTRR and CTRR+ methods achieve better results for travel route recommendations compared with the shortest distance path method.

七、乘车路线

方式1:西北大学长安校区东门站途径公交车268路,311路,321路,616

方式2:开车从西北大学东门进信息学院

undefined


地址:西安市长安区郭杜教育科技产业园区学府大道1号 邮编:710127

版权所有:西北大学 ICP备案号:陕ICP备05010980号