
项目:问卷
需求:WORD 导入问卷
背景:运营那里有几百个 WORD 格式问卷,如果去后台手动录入,无疑工作量很大,希望能直接导入。
心情:接到需求之后五味杂陈,因为以前做过 excel 导入,而且有现成的插件,代码也是一搜索一堆。
word 导入无疑涉及到了知识盲点,但是需求就在那里,又怼不过产品同学!只能硬着头皮上了。
难点:word 不好读取内容,内容读出来不好结构化。
解决问题思路:
先读取 WORD, 再说怎么结构化。
读取 WORD:
一开始想着用 PHPWORD, 毕竟 PHPOFFICE 这么成熟的插件应该可以直接读取到 WORD 内容吧。
然而现实很骨感,找遍了文档并没有找到直接读取到 WORD 内容的方法。PHPWORD 只提供了把 WORD 转换成 HTML,TDF 的方法。
转换思路:
既然不能读取 WORD, 那我可以读取 HTML, 只需要把 WORD 转换成 HTML 就可以了,然后读取 HTML 内容就行。
代码:
<?php
namespace App\Console\Commands;
use Illuminate\Console\Command;
use PhpOffice\PhpSpreadsheet\Reader\Html;
use PhpOffice\PhpWord\Reader\Word2007;
class Test extends Command {
/**
* The name and signature of the console command.
*
* @var string
*/
protected $signature = 'word';
/**
* The console command description.
*
* @var string
*/
protected $description = 'word';
/**
* Create a new command instance.
*
* @return void
*/
public function __construct() {
parent::__construct();
}
/**
* Execute the console command.
*
* @return int
*/
public function handle(Word2007 $word) {
//WORD转换HTML
$result=$word->load(storage_path('测试.docx'));
$write=new \PhpOffice\PhpWord\Writer\HTML($result);
$write->save(storage_path().'/测试.html');
//读取HTML内容
$document=new \DOMDocument();
$document->loadHTML(file_get_contents(storage_path('测试.html')));
$html=simplexml_import_dom($document);
dd((array)$html->body);
}
}开始测试:新建 测试.docx
测试.docx 内容:

执行脚本:
php artisan word
结果:

相关阅读 更多
-
抖音网页版官方入口 抖音网页版在线观看官网 时间:2026-01-08 -
GitLab、Git、Github、Gitee四者的区别 时间:2026-01-08 -
顺磁性和逆磁性的区别 顺磁性和逆磁性的判断方法 时间:2026-01-08 -
顺磁性是什么意思 顺磁性材料有哪些 时间:2026-01-08 -
usim卡是什么意思 usim卡和sim卡的区别 时间:2026-01-08 -
Web前端四大渲染模式SSR、CSR、ISR、SSG的定义和区别 时间:2026-01-08
今日更新
-
qq朋友网登录入口-qq朋友网网页版一键登录
阅读:18
-
刘梗宏女孩是什么梗?揭秘网络爆火健身主播的魔性口号与粉丝狂欢现象,看完秒懂!
阅读:18
-
啵乐漫画app最新版本下载-啵乐漫画官方安装包免费下载
阅读:18
-
Freeok免费追剧app下载安装-Freeok免费追剧软件官方版本
阅读:18
-
哔哩哔哩漫画网页版官方入口-哔哩哔哩漫画官网一键直达
阅读:18
-
七夕漫画官方下载入口安卓最新版-七夕漫画官方下载入口免费安装包
阅读:18
-
夸克网页版入口-夸克浏览器2026最新网页版登录
阅读:18
-
刘国梁不懂球是什么梗?揭秘国乒教练爆笑名场面由来
阅读:18
-
1-75级抖音刷多少-抖音1-75级价格表
阅读:18
-
漫蛙漫画网安卓版下载-漫蛙漫画官方最新版本安装入口
阅读:18










