自然语言处理(NLP)是人工智能和语言学领域的一个分支学科,同时也是机器学习中最热的一个方向之一。试想想,机器可完全明白人类的语言,并且可以娴熟地使用自然语言与人类沟通,这不就是人工智能的目标?目前,我们处理的数据,并不仅仅只有数值型数据,还包含了大量的文本数据。对于传统的分析技术来说,文本数据中的真正含义无法真正解析出来,是对文本信息的较大浪费。幸好,现在各种文本预处理、文本挖掘技术已日渐成熟,可以帮助我们从文本中提取出更多有意义的信息。
第一部分:算法软件基础:介绍不同算法工具的基本使用语法
第一节:语言模型SRILM——用SRILM训练语言模型
第二节: 隐马尔可夫模型HTK入门——HTK的安装与使用
第三节: 隐马尔可夫模型HTK深入——HTK使用详解
第四节: 隐马尔可夫模型HTK实例——简单的语音拨号应用程序
第五节: 条件随机场CRF++——CRF++的安装与使用
第六节: 较大熵模型OpenNLP——OpenNLP的安装与基本功能
第七节: 较大熵模型MALLET——MALLET的安装与使用
第八节:中文NLP工具包——FudanNLP入门
第九节:中文NLP工具包——StanfordNLP各个模块介绍
第二部分:实验案例操作
第十节:中文NLP基础,分词处理与词性标注——对比常用的中文分词工具的使用
第十一节:命名实体识别的实现
第十二节:文本分类与情感分析——商品评论倾向性分析
第十三节:文本关键信息提取——关键词提取与文本摘要
|