8个常用python库从安装命令及应用程序( 六 )


在这一节中,我们只是提醒读者有这么一个库的存在,而且这个库很强大,如果读者想深入了解这个库,可以去阅读官方帮助文档或参考链接 。
值得一提的是,Gensim把Google在2013年开源的著名的词向量构造工具Word2Vec编译好了,作为它的子库,因此需要用到Word2Vec的读者也可以直接使用Gensim,而无须自行编译了 。
Gensim的作者对Word2Vec的代码进行了优化,所以它在Gensim下的表现比原生的Word2Vec还要快 。(为了实现加速,需要准备C++编译器环境,因此,建议使用Gensim的Word2Vec的读者在Linux系统环境下运行 。)
下面是一个Gensim使用Word2Vec的简单例子,如代码清单2-35所示 。

  • 代码清单2-35 Gensim使用Word2Vec的简单示例
# -*- coding: utf-8 -*- import gensim, logging logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level= logging.INFO) # logging是用来输出训练日志 # 分好词的句子,每个句子以词列表的形式输入 sentences = [['first', 'sentence'], ['second', 'sentence']] # 用以上句子训练词向量模型 model = gensim.models.Word2Vec(sentences, min_count=1) print(model['sentence']) # 输出单词sentence的词向量 。最后,小编想说:我是一名python开发工程师,
整理了一套最新的python系统学习教程,

推荐阅读