pylucene分别安装在linux和windows(官方无Windows版的pylucene,要自编译)

2023-11-10

pylucene 安装

  目前python很多包只支持32位,不支持64位。所以安装python尽量使用32位。不要64位,否则很多功能用不了
    参考文章
    http://blog.csdn.net/orzli/article/details/12401507
    http://www.shangxueba.com/jingyan/2262010.html
    http://blog.163.com/zhoutao_1001/blog/static/979024220123177225922/
    http://blog.csdn.net/kernelspirit/article/details/2127851

说明:

编译并安装pylucene很简单,但是配置合适的依赖环境麻烦。
网上有人安装,但各个软件版本都太老,仅供参考:
    配置1
      Python 2.7.10  32bit 
      JDK 1.8 32bit
      Java Ant 1.9.6 
      make-3.8.1 
      VS2008 
      pylucene 
      jcc (源码在pylucene源码的目录下,应该是存在版本依赖关系的,无需另外下载
      --------------------------------------------------------------------------
     配置2
      Python 2.7.3
      (pylucene)lucene-4.4.0-py2.7-win32
      JCC-2.17-py2.7-win32    用于python启动Java虚拟机
      JCC和Pylucene下载地址:http://lucene.apache.org/pylucene/
      jdk-1.6.0_45 win32   请用32位的java,64位的jdk貌似不支持
      apache-ant-1.8.4 编译lucene的时候需要用到ant,http://ant.apache.org/bindownload.cgi
      make-3.8.1 
      http://sourceforge.net/projects/gnuwin32/files/make/有windows版傻瓜一键安装的exe程序
linux安装pylucene
    http://blog.csdn.net/qingyuanluofeng/article/details/49130129
Windows安装pylucene(步步惊心,没有成功)
  (1)jdk
       jdk在C:\Program Files\Java\jre1.8.0_101
       环境变量: “计算机”右键 -> 属性 -> 高级系统设置 -> 环境变量
            PATH变量中加入C:\Program Files\Java\jre1.8.0_101;C:\Program Files\Java\jre1.8.0_101\bin;C:\Program Files\Java\jre1.8.0_101\lib;C:\Program Files\Java\jre1.8.0_101\jre\bin\server
            * 注意这个bin\server一定要加进去,否则JCC找不到jvm.dll
      可以设JAVA_HOME变量为C:\Program Files (x86)\Program Files\Java\jre1.8.0_101


  (2)ant安装
      编译用ant,需要先安装ant。pylucene的Makefile用ant
        官网http://ant.apache.org/直接下最新版本
          apache-ant-1.9.8-bin.zip(bin直接执行)源码版和manual版不要
        或者找老版本在http://archive.apache.org/dist/ant/binaries/中下载
      解压到C:\ant下(不要放到默认Program Files下,名称的空格会应该ant的使用。需要麻烦的设定才能兼容)
      修改环境变量
        ANT_HOME: C:\java\apache-ant-1.8.4
        PATH加上%ANT_HOME%\bin


  -----------------------------------------------------------------------
  下面步骤中,jcc怎么也装不上?
      可能是python是64位,也可能是VC没装好(vs2008)与64版本冲突,官网给的Compiler for Python 2.7 也是32位的?
      最终替代方案参考
    http://blog.donews.com/Dzhigner/archive/2013/07/19/1295109.aspx
   说白了,也就是翻墙下载两个egg,直接装上,注意版本依赖又是一个坑,下载的jcc和pylucene必须版本兼容,需要人工确认,否则执行会出问题。
  原始步骤(未成功)
  (3)pylucence 下载
      官网http://www.apache.org/dyn/closer.cgi给出镜像地址http://mirrors.cnnic.cn/apache/
      进入文件夹Lucene/下载(此外还有java版、nutch、solr等)
      解压后,内部含JCC文件

  (4)安装JCC文件
      用于python启动Java虚拟机,生成 C++ 代码以在 C++ 和 Python 程序中调用 Java 代码。
      在pylucence的包里直接就有,为了版本依赖。直接修改setup.py文件,将JAVA_HOME全部替换成真实的jdk。
      运行命令
        python setup.py build
        python setup.py install

        python\D:\pylucene-6.2.0\jcc\setup.py build 
        报错:
            building 'jcc' extension
            error: Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27
        这是因为机器上没有VC,在http://aka.ms/vcpython27下载Microsoft Visual C++ Compiler for Python 2.7(自己安装只能安VS2008,别的版本有问题http://blog.csdn.net/roler_/article/details/40398789)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pylucene分别安装在linux和windows(官方无Windows版的pylucene,要自编译) 的相关文章

  • 使 django 服务器可以在 LAN 中访问

    我已经安装了Django服务器 可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时 从同一网络下的另一台电脑 my ip
  • Python(Selenium):如何通过登录重定向/组织登录登录网站

    我不是专业程序员 所以请原谅任何愚蠢的错误 我正在做一些研究 我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语 我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库 在我解决
  • 通过最小元素比较对 5 个元素进行排序

    我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划 除此之外 复杂性是无关紧要的 结果是一个对的列表 表示在另一时间对列表进行排序所需的比较 我知道有一种算法可以通过 7 次比较 总是在元素之间
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • Python - StatsModels、OLS 置信区间

    在 Statsmodels 中 我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
  • 根据列值突出显示数据框中的行?

    假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
  • 如何从网页中嵌入的 Tableau 图表中抓取工具提示值

    我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值 以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例 我从要从中抓取的原始网页中获取了此网址 https covid19 colo
  • 是否可以忽略一行的pyright检查?

    我需要忽略一行的pyright 检查 有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
  • 基于代理的模拟:性能问题:Python vs NetLogo & Repast

    我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型 我发现我的代码的性能比 NetLogo 慢约 3 倍 这可能是我的代码的问题 还是Python的固有限制 显然 这只是代码的一个片段 但 Python 却花费了三分
  • 如何使用 OpencV 从 Firebase 读取图像?

    有没有使用 OpenCV 从 Firebase 读取图像的想法 或者我必须先下载图片 然后从本地文件夹执行 cv imread 功能 有什么办法我可以使用cv imread link of picture from firebase 您可以
  • 从 Flask 访问 Heroku 变量

    我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
  • BeautifulSoup 中的嵌套标签 - Python

    我在网站和 stackoverflow 上查看了许多示例 但找不到解决我的问题的通用解决方案 我正在处理一个非常混乱的网站 我想抓取一些数据 标记看起来像这样 table tbody tr tr tr td td td table tr t
  • 添加不同形状的 numpy 数组

    我想添加两个不同形状的 numpy 数组 但不进行广播 而是将 缺失 值视为零 可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状 我正在弄乱每个 np shape
  • SetCurrentDirectoryW 中的错误 206

    在我之后之前不清楚的问题 https stackoverflow com questions 44389617 long path name in setcurrentdirectoryw 我以某种方式能够创建一个具有长路径名的目录 但是
  • 如何在Python中对类别进行加权随机抽样

    给定一个元组列表 其中每个元组都包含一个概率和一个项目 我想根据其概率对项目进行采样 例如 给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样 在 python 中执行此操作的规范方法是什么 我查看了 random 模
  • Fabric env.roledefs 未按预期运行

    On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
  • 对年龄列进行分组/分类

    我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
  • 有人用过 Dabo 做过中型项目吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我们正处于一个新的 ERP 风格的客户端 服务器应用程序的开始阶段 该应用程序是作为 Python 富客户端开发的 我们目前正在评估 Dabo
  • Scrapy:如何使用元在方法之间传递项目

    我是 scrapy 和 python 的新手 我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法 如 sc
  • 导入错误:没有名为 site 的模块 - mac

    我已经有这个问题几个月了 每次我想获取一个新的 python 包并使用它时 我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误 实际上 我无法使用任何新软件包 因为每次我

随机推荐