2024年10月万能君的工具箱 V2.2 绿色版

发布时间:

  ⑴万能君的工具箱是网友开发的一款实用工具集合,其中包括批量音频转文字小工具,目前包括音频转文字、文字转语音、截图文字识别、批量图片文字识别、复制翻译、图种制作功能,支持批量选取音频转换,不限时长,免费!

  ⑵、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。

  ⑶、文字转语音:转的语音不要太生硬。

  ⑷、截图文字识别(OCR:截屏完成即可弹出截图所含图片中的文字。

  ⑸、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。

  ⑹、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。

  ⑺、图种制作:这个不入流,纯属个人爱好,没啥技术含量。

  ⑻需求产生开发动力,基于百度AI和pyqt制作了自己的小工具,解决了上述所有需求,需求也就就是功能了。

  ⑼、批量音频转文字

  ⑽(比如批量识别小学生课文。

  ⑾(比如识别长达五分钟的《荷塘月色》。

  ⑿(识别岳云鹏的相声。

  ⒀这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp格式的音频文件。

  ⒁点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。

  ⒂在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:

  ⒃看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。如下演示:

  ⒄没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。

  ⒅打开可能慢,且软件开启后带着cmd黑框。

  ⒆要有API Key、Secret Key,自己去百度注册获取,免费可以识别万次哈。

  ⒇加入免费的音频转文字接口,免费的有普通话、英文、粤语、四川话识别,速度慢些,但准确率还可以。