当前位置: 首页 > news >正文

网站网络营销推广制作高端网站设计定制公司

网站网络营销推广制作,高端网站设计定制公司,长沙市网站制作公司,seo搜索引擎优化心得体会以下分别介绍基于 C 批量提取 PDF 里文字内容并导出到表格#xff0c;以及批量给 PDF 文件改名的实现方案、步骤和应用场景。 批量提取 PDF 文字内容并导出到表格 应用场景 文档数据整理#xff1a;在处理大量学术论文、报告等 PDF 文档时#xff0c;需要提取其中的关键信…以下分别介绍基于 C 批量提取 PDF 里文字内容并导出到表格以及批量给 PDF 文件改名的实现方案、步骤和应用场景。 批量提取 PDF 文字内容并导出到表格 应用场景 文档数据整理在处理大量学术论文、报告等 PDF 文档时需要提取其中的关键信息如标题、作者、摘要等并整理到表格中方便后续的数据分析和比较。信息归档企业或机构可能有大量的合同、协议等 PDF 文档需要将其中的重要条款、日期、金额等信息提取出来存储到表格中进行统一管理和查询。 实现方案和步骤 1. 选择合适的库 Poppler用于解析 PDF 文件并提取文字内容。Poppler 是一个开源的 PDF 渲染库提供了 C 接口可以方便地进行 PDF 文本提取。LibXL用于创建和操作 Excel 表格。它是一个跨平台的 C 库支持创建、读取和修改 Excel 文件。 2. 安装依赖库 在 Linux 系统上可以使用包管理器安装 Poppler 和 LibXL。例如在 Ubuntu 上可以使用以下命令安装 Poppler bash sudo apt-get install libpoppler-cpp-dev对于 LibXL需要从其官方网站下载库文件并将其包含到项目中。 3. 编写代码 cpp #include iostream #include fstream #include vector #include string #include poppler/cpp/poppler-document.h #include poppler/cpp/poppler-page.h #include libxl.husing namespace libxl;// 提取 PDF 文件中的文字内容 std::string extractTextFromPDF(const std::string filePath) {poppler::document* doc poppler::document::load_from_file(filePath);if (!doc || doc-is_locked()) {delete doc;return ;}std::string text;for (int i 0; i doc-pages(); i) {poppler::page* page doc-create_page(i);if (page) {text page-text().to_latin1();delete page;}}delete doc;return text; }// 批量提取 PDF 文件内容并导出到 Excel 表格 void batchExtractPDFsToExcel(const std::vectorstd::string pdfFiles, const std::string outputFilePath) {Book* book xlCreateBook();if (book) {Sheet* sheet book-addSheet(PDF Text);if (sheet) {for (size_t i 0; i pdfFiles.size(); i) {std::string text extractTextFromPDF(pdfFiles[i]);sheet-writeStr(i, 0, pdfFiles[i].c_str());sheet-writeStr(i, 1, text.c_str());}}book-save(outputFilePath.c_str());book-release();} }int main() {std::vectorstd::string pdfFiles {file1.pdf,file2.pdf,// 添加更多 PDF 文件路径};std::string outputFilePath output.xlsx;batchExtractPDFsToExcel(pdfFiles, outputFilePath);return 0; }4. 编译和运行 使用以下命令编译代码 bash g -o extract_pdf extract_pdf.cpp -lpoppler-cpp -lxl运行生成的可执行文件 bash ./extract_pdf批量给 PDF 文件改名 应用场景 文件整理当从不同来源收集了大量 PDF 文件文件名杂乱无章时需要根据文件内容或特定规则对文件进行重命名以便更好地管理和查找。数据导入在将 PDF 文件导入到某个系统或数据库时要求文件名遵循一定的命名规范此时需要对文件进行批量重命名。 实现方案和步骤 1. 选择合适的库 使用标准 C 库中的 filesystem C17 及以上来处理文件和目录操作。 2. 编写代码 cpp #include iostream #include filesystem #include stringnamespace fs std::filesystem;// 批量给 PDF 文件改名 void batchRenamePDFs(const std::string directoryPath) {int counter 1;for (const auto entry : fs::directory_iterator(directoryPath)) {if (entry.is_regular_file() entry.path().extension() .pdf) {fs::path newPath entry.path().parent_path() / (std::to_string(counter) .pdf);fs::rename(entry.path(), newPath);std::cout Renamed entry.path() to newPath std::endl;counter;}} }int main() {std::string directoryPath ./pdfs; // 替换为实际的 PDF 文件目录batchRenamePDFs(directoryPath);return 0; }3. 编译和运行 使用以下命令编译代码 bash g -stdc17 -o rename_pdf rename_pdf.cpp运行生成的可执行文件 bash ./rename_pdf以上代码示例提供了基本的实现思路你可以根据实际需求进行扩展和修改。
http://www.hkea.cn/news/14559667/

相关文章:

  • 个人网站名称江苏省建设主管部门网站
  • 兰州专业网站建设团队石家庄网站制作哪家好
  • 广州网站建设交易正规的企业网站建设
  • 南通优普营销网站建设西安学校网站建设哪家好
  • 上海网站推广策划电商网站开发prd
  • 建立网站建设专门做字体设计的网站
  • 深圳展览设计网站建设展厅设计公司西安
  • 教育网站如何做经营国家反诈中心app下载安装
  • 昆山品牌网站wplounge wordpress主题
  • 在线做免费网站做网站需要icp吗
  • 官网和网站的区别网站制作 文案
  • 亚马逊网站推广怎么做山东天齐建设集团网站
  • 免费网站的软件下载响应式网页源码
  • 织梦cms做电影网站国外优秀企业网站欣赏
  • 备案网站地址内网网站建设流程
  • php做的网站模板下载地址上海企业注销简易流程
  • 网站怎么增加代码设计上海2021门票
  • 网站开发kpi网站开发公司选择
  • 医院网站如何备案怎么申请自己公司的邮箱
  • 企业网站建设研究论文北京好的做网站的公司有哪些
  • 咸阳微网站建设服务器怎么做网站
  • 网站职业技能培训班想把公司的外部网站替换
  • 如何拷贝网站代码linux下做网站
  • 设计之家官方网站云优化 网站建设
  • 网站通栏广告素材兰州网站设计哪个平台好
  • zencart网站管理 1.5新产品推广方案策划
  • 桓台网站建设摩托车官方网
  • 农村pc网站开发wordpress页面内容调用
  • 建筑设计自学网站黑白网站设计
  • 网站主机空间用哪个好论坛网站备案