cd autodl-tmp
mkdir mu
cd mu
用于存放虚拟环境和 MinerU 相关文件。
uv(Python 环境管理工具)pip install uv
uv 用于快速创建 Python 虚拟环境和管理依赖。
uv venv
创建 .venv 虚拟环境目录。
source .venv/bin/activate
激活后终端会显示类似:
(.venv) root@xxx:~/autodl-tmp/mu#
使用 阿里云 PyPI 镜像加速安装:
uv pip install "mineru[core,lmdeploy]==2.6.8" --system --index-url https://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
说明:
mineru[core,lmdeploy]:安装核心功能和 lmdeploy 推理支持\--index-url:使用阿里云镜像源\--trusted-host:允许信任镜像地址mineru -p /root/autodl-fs/142 -o /root/autodl-fs/142output --source modelscope
参数说明:
参数 说明
-p 输入 PDF 文件所在目录
-o 输出转换结果目录
--source modelscope 从 ModelScope 下载模型
autodl-tmp/
└── mu/
├── .venv/
└── (mineru环境)
输入PDF:
/root/autodl-fs/142
输出结果:
/root/autodl-fs/142output
转换完成后:
输出目录通常包含:
<!-- -->
142output/ ├── markdown/ ├── json/ ├── images/ └── logs/
常见用途: