课程详情
微软大咖人工智能PTA+强力推荐信
分享到:
微软大咖人工智能PTA+强力推荐信
价格:
19999.00
课程详情
课程周期: 一个月 授课老师: Li导师

导师介绍

李导师,现就职于微软10年开发和带团队经验,从业经验丰富,涉猎广,擅长人工智能落地应用,后端服务开发部署,全栈前端开发等方向

技能要求

爬虫,自然语言处理

项目简介

微软公司有庞大的搜索和信息流生态系统,语义理解以及其应用是微软的核心竞争力之一。在搜索和信息流生态系统中,爬虫是上层应用的基石。在项目中,我们将复现简单的搜索引擎检索结果以及信息流推荐等场景。

阶段一

1.   了解网络请求、网络协议和网络通信的细节,掌握requests等发包工具,能实现本机与远程服务器的手动通信

2.   掌握BeautifulSoup等网页解析框架,能通过规则设置和解析框架剥离出想要得到的文本内容

3.   掌握其他主流爬虫工具,如webdriver,appium等,能够跨平台,跨程序语言地收集数据

4.   掌握常见的开发工具,如git,远程主机,Linux系统命令等

案例:高校网站新闻爬取

阶段二

1.   学习掌握常见的机器学习框架,sklearn,gensim等。

2.   掌握word2vec框架,了解文本向量化的原理,学会自己训练word2vec模型并学会调用预训练模型。

3.   学习文本处理与语义分析,利用sklearn等框架搭建文本分类器。熟悉tensorflow等底层机器学习框架,学会使用tensorflow搭建复杂神经网络。

案例:新闻主题分类

阶段三

1.   掌握经典模型,如RNN,LSTM,并了解理论原理与作用机制。学会分析NLP任务,学会模型选取。

2.   学习实体词检测算法,了解隐马尔科夫等经典解决方案,和LSTM,BERT等进阶自然语言处理模型,进行性能对比,并实现上层应用。

案例: Pos Tagging

阶段四

实战训练:结合所掌握的深度学习模型,实体词检测算法,将文章的实体词/同义词和维基百科链接做映射

项目产出:NER和维基百科的应用,爬虫信息流应用,Github主页优化,导师推荐信。认证证书。