51CTO Python数据分析系列视频课程--玩转文本挖掘

2023年11月15日 39条评论 2,034次阅读

资源简介

文章目录

适合人群：

希望能够成为Python编程和数据分析的跨界人才，目前尚未成功，但仍然在不断努力的人。

你将会学到：

从基本的分词、词袋模型、分布式表示等概念开始，多面深入学习文本挖掘技术的各个方面。

课程简介：

请至PC端网页下载本课程代码课件及数据。

文本挖掘（TM），又称自然语言处理（NLP），是AI时代炙手可热的数据分析挖掘前沿领域，其所涉及的人机对话系统，推荐算法，文本分类等技术在BAT等企业中都得到广泛应用。

本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。

本次课程将会从基本的分词、词袋模型、分布式表示等概念开始，多面介绍文本挖掘技术的各个方面，特别会针对目前最热的word2vec，gensim 等结合实际案例进行学习，帮助学员直接升级至业界技术前沿。

学习完本课程后，学员将能够独立使用Python环境完成中文文本挖掘的各种工作。

资源目录

——/计算机教程BTDLG/17-51CTO/120-Python数据分析系列视频课程--玩转文本挖掘/
├──Python数据分析系列视频课程--玩转文本挖掘  
|   ├──TM10-01.pdf  684.72kb
|   ├──TM11-01.pdf  339.54kb
|   ├──TM12n-01.pdf  783.83kb
|   ├──TM2-01.pdf  876.99kb
|   ├──TM3-01.pdf  1.07M
|   ├──TM4-01.pdf  1.23M
|   ├──TM5-01.pdf  767.66kb
|   ├──TM6-01.pdf  721.23kb
|   ├──TM7-01.pdf  829.94kb
|   ├──TM8-01.pdf  961.02kb
|   ├──TM9-01.pdf  635.82kb
|   ├──TMData1801101-01.zip  7.19M
|   ├──TMData190320-01.zip  7.27M
|   ├──TM浣滀笟10-01.pdf  122.79kb
|   ├──TM浣滀笟11-01.pdf  113.64kb
|   ├──TM浣滀笟12-01.pdf  136.56kb
|   ├──TM浣滀笟5-01.pdf  109.51kb
|   ├──TM浣滀笟6-01.pdf  125.58kb
|   ├──TM浣滀笟7-01.pdf  122.44kb
|   ├──TM浣滀笟8-01.pdf  117.65kb
|   ├──TM浣滀笟9-01.pdf  117.64kb
|   ├──浣滀笟2-01.pdf  116.40kb
|   ├──浣滀笟3-01.pdf  114.65kb
|   └──浣滀笟4-01.pdf  117.18kb
├──1-1 什么是文本挖掘.mp4  32.39M
├──1-2 文本挖掘的基本流程和任务.mp4  24.26M
├──1-3 文本挖掘的基本思路.mp4  21.74M
├──1-4 语料数据化时需要考虑的工作.mp4  26.11M
├──10-1 情感分析概述.mp4  66.84M
├──10-2 情感分析的词袋模型实现.mp4  35.64M
├──10-3 情感分析的分布式表达实现.mp4  47.16M
├──11-1 自动摘要的基本原理.mp4  24.56M
├──11-2 自动摘要的效果评价.mp4  18.19M
├──11-3 自动摘要的python实现.mp4  38.16M
├──12-1 RNN的基本原理.mp4  23.30M
├──12-2 LSTM的基本原理.mp4  22.81M
├──12-3 Keras+TensorFlow组合的优势.mp4  9.88M
├──12-4 Keras+TensorFlow组合的安装.mp4  9.35M
├──12-5 案例1：数据准备.mp4  36.45M
├──12-6 案例1：模型拟合.mp4  31.85M
├──12-7 案例2：数据准备.mp4  37.53M
├──12-8 案例2：模型拟合.mp4  26.76M
├──2-1 Python常用IDE简介.mp4  32.15M
├──2-2 Anaconda的安装与配置.mp4  31.21M
├──2-3 Jupyter Notebook的基本操作.mp4  25.51M
├──2-4 NLTK的安装与配置.mp4  30.69M
├──2-5 什么是语料库.mp4  60.50M
├──2-6 准备《射雕》语料库.mp4  59.96M
├──3-1 分词原理简介.mp4  32.60M
├──3-2 结巴分词的基本用法.mp4  33.28M
├──3-3 使用自定义词典和搜狗细胞词库.mp4  45.46M
├──3-4 去除停用词.mp4  52.25M
├──3-5 词性标注及其他.mp4  30.82M
├──4-1 词频统计.mp4  38.46M
├──4-2 词云概述.mp4  22.00M
├──4-3 wordcloud包的安装.mp4  37.31M
├──4-4 绘制词云.mp4  66.21M
├──4-5 设置词云背景模板.mp4  45.61M
├──4-6 修改词云颜色.mp4  53.05M
├──5-1 词袋模型.mp4  33.47M
├──5-2 词袋模型的gensim实现.mp4  56.38M
├──5-3 用Pandas生成文档词条矩阵.mp4  56.58M
├──5-4 用sklearns生成文档-词条矩阵.mp4  57.52M
├──5-5 从词袋模型到N-gram模型.mp4  27.33M
├──5-6 文本信息的分布式表示.mp4  29.78M
├──5-7 共现矩阵.mp4  23.38M
├──5-8 NNLM模型的突破.mp4  23.37M
├──5-9 word2vec一出，满座皆惊.mp4  53.30M
├──6-1 关键词提取的基本思路.mp4  24.67M
├──6-2 TF-IDF 算法.mp4  25.96M
├──6-3 TF-IDF算法的jieba实现.mp4  52.75M
├──6-4 TF-IDF算法的sklearn实现.mp4  27.91M
├──6-5 TF-IDF算法的gensim实现.mp4  27.38M
├──6-6 TextRank算法.mp4  41.64M
├──7-1 主题模型概述.mp4  48.98M
├──7-2 主题模型的sklearn实现.mp4  76.04M
├──7-3 主题模型的gensim实现.mp4  95.95M
├──8-1 基本概念.mp4  29.22M
├──8-2 词条相似度：word2vec训练.mp4  47.75M
├──8-3 词条相似度：word2vec应用.mp4  42.71M
├──8-4 文档相似度的词袋模型实现.mp4  42.60M
├──8-5 doc2vec.mp4  48.04M
├──8-6 文档聚类.mp4  41.86M
├──9-1 文本分类概述.mp4  40.29M
├──9-2 朴素贝叶斯算法.mp4  31.99M
├──9-3 算法的sklearn实现.mp4  49.09M
└──9-4 算法的NLTK实现.mp4  33.69M