Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
从 doc 和 docx 中提取文本
我想知道如何阅读 doc 或 docx 的内容 我使用的是 Linux VPS 和 PHP 但如果有使用其他语言的更简单的解决方案 请告诉我 只要它在 Linux 网络服务器下工作即可 在这里我添加了从中获取文本的解决方案 doc docx
php
Linux
VPS
docx
doc
iTextSharp - 将 word doc/docx 转换为 pdf
我知道 iTextSharp 可用于将文档转换为 pdf 但首先我们必须使用 iTextSharp text Document 从头开始 创建一个文档 然后向该文档添加元素 如果我有一个现有的 doc 文件 是否可以使用 iTextShar
pdf
msword
itext
docx
doc
有没有办法生成 DOCX 文件的缩略图?
我已经使用像 ASPOSE 这样的 付费 工具完成了这项工作 但我很好奇是否有任何开源工具可以做到这一点 我确信可能有工具可以做到这一点 但如果您可以将文件转换为可以轻松光栅化的格式 那么可能值得探索 例如 将工作文档转换为 pdf 然后对
NET
preview
docx
Jinja2 用于单词模板
我想使用 jinja2 进行单词模板 就像提到的那样this http reinout vanrees org weblog 2012 07 04 document automation html短文 我面临的问题如下 如果我把 title
python
Jinja2
templateengine
docx
通过python读取Docx文件
有谁知道一个Python库来读取docx文件 我有一个Word文档 我正在尝试从中读取数据 有几个软件包可以让您执行此操作 查看 python docx https python docx readthedocs io en latest
python
docx
pythondocx
页码 python-docx
我正在尝试用 python 创建一个程序 它可以在 docx 文件中查找特定单词并返回它出现的页码 到目前为止 在浏览 python docx 文档时 我无法找到如何访问页码 甚至无法找到页码所在的页脚 有没有办法使用 python doc
python
docx
pythondocx
开源 php docx 到 pdf 转换?
是否有任何开源 PHP 工具可以用来将 doc docx 转换为 pdf 如果您有任何好的教程或工具 将不胜感激 我正在研究 phpLiveDocx 但看起来他们按月收费 或者也许是 php 或 linux 中的 odt 到 pdf 尝试
php
pdf
docx
doc
py2exe/py2app 和 docx 不能一起工作
在 Windows 7 上安装 docx D Program Files x86 Python27 Lib site packages 如下所示 Installed docx on OS X at Library Frameworks Py
python
py2exe
docx
py2app
在 C# 中将 Html 转换为 Docx [关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我想在 C 中将 html 页面转换为 docx 我该怎么做 我的解决方案使用Html2OpenXml
c
docx
ColdFusion 和 Java(docx4j 库)
我需要进行 docx 操作 查找 替换占位符以及选中 取消选中复选框 由于 ColdFusion 10 与 Java 集成得很好 我决定尝试使用 Java 库 docx4j 它基本上模仿了 OpenXML SDK net 平台 我在自定义文
Java
coldfusion
jar
docx
docx4j
如何在新的 docx 文档中创建页眉/页脚?
我想使用 XWPF jar apache poi 在 docx 文档 一个新的且不存在的文档 上创建页眉和页脚 当我使用XWPFHeaderFooterPolicy policy document getHeaderFooterPolicy
Java
header
docx
XWPF
使用 OpenXml 调用 AddAlternativeFormatImportPart 后文档损坏
我正在尝试在 docx 文件中创建 AddAlternativeFormatImportPart 以便通过 AltChunk 在文档中引用它 问题是下面的代码导致 docx 文件被 Word 读取为损坏且无法打开 string html s
c
msword
OpenXML
openxmlsdk
docx
在python docx模块中使用段落功能时减少垂直空间
我正在添加单行文本 例如此字符串 这只是一些文本 对 Word 文档使用 docx paragraph 函数 它工作得很好 除了我想减少文本之间的垂直间距 我有什么想法可以做到这一点 谢谢 我创建了一个测试文档 前两个段落以正常间距隔开 接
python
python27
docx
DOCX 和 PDF 的版本控制?
我一直在玩git and hg最近 我突然想到这种东西对于文档来说非常有用 我有一个在 DOCX 中编辑并导出为 PDF 的文档 我尝试同时使用git and hg对它进行版本控制 结果是hg您最终只跟踪二进制文件 并且比较没有意义 虽然与
versioncontrol
pdf
docx
使用 C# 突出显示 Docx 中的文本
我需要突出显示 docx 文件中的一个句子 我有这段代码 并且它对于许多文档都可以正常工作 但我注意到对于某些文档 文档中的文本是逐字设置的 而不是整个句子 我的意思是每个单词它自己的Run 所以当搜索该句子时 找不到它 因为它在docx中
c
OpenXML
highlight
docx
如何在 Apache POI(java) 中读取 .docx 中的字体大小和字体名称
这是我的代码 XWPFRun run runlist get 0 double fontsize double run getFontSize String fontfamily String run getFontFamily 当它读取
Java
fonts
apachepoi
Document
docx
docx4j 无法渲染
我在用docx4j 导入XHTML https github com plutext docx4j ImportXHTML将 XHTML 转换为 docx 当渲染到 docx 时 我注意到它不渲染 CSStext indent财产 p p
html
xhtml
docx
docx4j
wordml
Rails:如何在 Heroku 上使用系统 zip 从 xml 模板制作 docx?
我在本地工作 将模板文件存储在 Rails root tmp using system cd tmp template zip r filename 压缩文件 将 docx zip 存档 发送到 S3 然后发送到浏览器 问题是 Heroku
rubyonrails
ruby
heroku
zip
docx
使用 Apache poi 从 docx 获取文本样式
我正在尝试从 MS docx 文件中获取样式信息 使用添加的样式 如粗体 斜体 编写文件内容没有问题 字体大小等 但读取文件内容并获取样式信息不太清楚 我尝试过使用 XWPFDocument 这个 API 似乎没有读取样式的能力 我现在正在
Java
apache
msword
apachepoi
docx
docx4j 查找和替换
我有带有一些占位符的 docx 文档 现在我应该用其他内容替换它们并保存新的 docx 文档 我开始于docx4j并找到了这个方法 public static List getAllElementFromObject Object obj
Java
docx
docx4j
«
1
2
3
4
5
6
7
»