PDF文档合并-报销单批量粘贴电子发票
- pymupdf
- pip install pymupdf
- https://pymupdf.readthedocs.io/en/latest/index.html
用 pymupdf 将电子发票转成图片,再插入报销单中
1 | # %% |
1 | # %% |
群晖自带的 ffmpeg 版本较低、支持编码库也比较少, 似乎不支持h265。从 SynoCommunity 升级 ffmpeg。
SynoCommunity 上给出了 DSM7版本 各套件的适配情况:
issue #4524: https://github.com/SynoCommunity/spksrc/issues/4524
略
命令如下:
1 | sudo mv /var/packages/VideoStation/target/bin/ffmpeg /var/packages/VideoStation/target/bin/ffmpeg.old |
恢复原来的设置
1 | # Reverse the above changes: |
PDF文档全文翻译,保留原有的PDF格式
1 | import fitz |
这里可查CPU、内存型号
https://kb.synology.com/en-us/DSM/tutorial/What_kind_of_CPU_does_my_NAS_have
群晖 DS218+ 原装内存只有 2GB,机器内预留了一个内存插槽,准备再加一个。
看了网上说群晖的机子认内存,而且最大识别到8G,也有说16G的,可以命令查询。
查看群晖内存 sudo dmidecode -t memory
:
1 | $ sudo dmidecode -t memory |
可以看到 Maximum Capacity: 16 GB
暑假马上结束了,悠悠约了琪琪姐姐要好好玩,连续几天晚上吃过饭都骑自行车去秦淮河边公园,一直玩到9点多。
我准备给她自行车加一个小灯,这样方便我能一眼找到她。
灯就用仙女棒上的,棒子已经丢了,一串小灯还留着,挺长的有1米多,但纽扣电池没电了,换成两节5号电池,刚好有个电池盒。
我正在安,悠悠说,爸爸你要做成能拆下来的。
我问为啥?
我下次要换大自行车,还把这灯安上去。
我说不用,到时候灯也换新的。
过一会,我把灯缠好了,线头准备焊到电池盒上。
悠悠说,你这可以换电池吗?没电了咋办。
可以换的,电池盒子可以打开。
有开关吗?灯是一直亮着的吗?
有。呶,关了。
企业微信推送 python版:
用电脑打开企业微信官网,https://work.weixin.qq.com/, 注册一个企业
我的企业
–> 最下边可以看到企业ID: corpid
管理企业
–> 应用管理
–> 创建应用
创建完成后可得到应用ID agentid
还在应用页面, 获取 Secret, 需要在企业微信客户端里接收。
这样就得到了 secret
DSM 升级至 7.0 之后,很多第三方套件不兼容了。
SynoCommunity 上给出了各套件的适配情况:
issue #4524: https://github.com/SynoCommunity/spksrc/issues/4524
zsh 也在其中,已经可以 build 了,但是还没正式发布。
我试着自己编译一下。
我的群晖是DS218+,CPU 是Intel Celeron J3355,架构是 apollolake(x64).
这里可以查:
https://github.com/SynoCommunity/spksrc/wiki/Architecture-per-Synology-model
https://kb.synology.com/en-us/DSM/tutorial/What_kind_of_CPU_does_my_NAS_have
管理员身份运行:
1 | dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart |
重启电脑。
开启虚拟器特性
1 | dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart |
下载安装包:
设置默认版本:
1 | wsl --set-default-version 2 |
ref: https://docs.microsoft.com/en-us/windows/wsl/install-win10
打开 Microsoft Store,安装 Ubuntu20.04
启动 Ubuntu20.04,创建账号、密码
安装 Windows Terminal(可选)
用 scoop 安装。
1 | scoop install windows-terminal |
windows-terminal 简单设置:
//wsl$/Ubuntu-20.04//home/bo
Jetbrains Mono
查看使用说明:ffmpeg -h
。
1 | # usage: |
转换命令如下:
1 | ffmpeg -i xxx.flac -ab 320k xxx.mp3 -y' |
这次我们用到的主要是 -ab
命令,用来指定音频转换的比特率,常见的有: 192K, 320K 等。
视频内字幕提取
这里是针对内封了硬字幕的视频,字幕已经成为了画面的一部分。
思路:简单用 opencv 提取视频内的所有帧,然后用 tesseract 对图片进行 ocr 识别。
目前的效率较低、准确度也一般,凑合用。
1 | scoop install tesseract |
帮助文档: https://tesseract-ocr.github.io/tessdoc/
官方体提供了三种训练好的模型:
我们这里选择 tessdata_fast
:
ref: https://github.com/develsoftware/GMinerRelease
gminer_2_XX_windows64.zip
, 解压后目录如下:1 | ├───miner.exe # 主程序 |
以在 火币矿池 挖 以太币 为例,
https://pool.huobi.pe/pow/help/3/all
主要参数如下:
1 | --algo: 算法,可省略; 对于以太币,默认 ethash |
1 | ./miner --algo ethash --server stratum+tcp://es.huobipool.com:1800 --user shenyoyo0706 |
也可以用配置文件运行, 或用快捷脚本运行, 参数设置方法是一样的。
1 | # Sample configuration file to mine BitcoinGold |
1 | Set-ExecutionPolicy RemoteSigned -Scope CurrentUser |
1 | irm get.scoop.sh | iex |
1 | cd ~ |
使用默认安装时经常卡住,是因为 https://get.scoop.sh 其实指向了 https://raw.githubusercontent.com/,因而导致安装失败。
对应的安装文件在这里: https://github.com/ScoopInstaller/Install/blob/master/install.ps1
以scoop安装oh-my-posh3。
1 | scoop install oh-my-posh |
新建、修改配置文件,运行:
1 | if (!(Test-Path -Path $PROFILE )) { New-Item -Type File -Path $PROFILE -Force } |
加入以下内容:
1 |
|
https://github.com/caj2pdf/caj2pdf/
1 | pip install PyPDF2 |
mutool.exe
文件放进 caj2pdf/
目录就行了。管理员身份运行:
1 | dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart |
重启电脑。
打开 Microsoft Store,安装 Ubuntu18.04
启动 Ubuntu18.04,创建账号、密码
安装 Windows Terminal(可选)
用 scoop 安装。
1 | scoop install windows-terminal |
windows-terminal 简单设置:字体、启动目录。
1 | { |