主题:网络爬虫技术和文本数据管理
基于R语言介绍网络爬虫的基础框架和文本数据的管理体系,包括常用爬虫工具的操作方法与使用示例、文本数据的清洗、文本数据的存储、文本数据的工程应用等内容。
主讲人:李舰
主持人:杨青骥
时间:2020年10月29日(星期四)9:00-12:00
地点:浦东校区第二教学楼304教室
主讲人简介:
李舰,洛易数据技术(上海)有限公司,业界知名数据科学家。统计学学士,软件工程硕士,商学博士,著有《统计之美》《数据科学中的R语言》等书。在R语言社区贡献了Rwordseg、tmcn、tmcn.word2vec等常用的文本分析程序包。
欢迎感兴趣的老师积极参加!
保险学院
2020年10月26日