
测试用了4款工具:录咖、AssemblyAI、录音转文字助手,还有重点测的听脑AI。内容准备了四种场景录音:2小时会议(普通话为主)、30分钟英语讲座(带点口音)、1小时采访对话(两人交替说话)、45分钟嘈杂环境录音(咖啡厅背景音)。测试标准就看三点:转文字准不准、快不快新富策略,功能全不全。
实际用下来,差别比我想的大。先说说会议场景。上周开2小时部门会,我同时开着4款工具录音。听脑AI是实时出文字的,说话人说完最多5秒,屏幕上就有字了。中间老板提到""下周三前交方案"",我直接在听脑AI里标了个重点,右边还能选发言人名字,自动区分谁谁说的。其他三款就不行,录咖和录音转文字助手得等会议结束才能开始处理,AssemblyAI稍微快点,但也得等会议结束后10分钟左右才有结果。而且后三款都不能实时标重点,得等全部转完再回头找,挺麻烦的。
学习场景也试了下。听30分钟英语讲座,教授有点印度口音。听脑AI直接出双语字幕,英文原文和中文翻译并排显示,准确率还行,""algorithm""这种词没认错。录咖只能出英文原文,翻译功能要单独开,而且是另外收费的。AssemblyAI虽然能出英文,但翻译功能用不了,点了就提示""需升级专业版""。录音转文字助手更别提,英语识别准确率低,好多词都认不出,""machine learning""给写成""machine leaning"",差太远了。
展开剩余69%最意外的是团队协作功能。我们部门5个人,会后需要一起改会议记录。听脑AI里直接把记录分享给他们,谁改了哪个词,右边都有提示。比如小李把""预算5万""改成""预算5-6万"",我这边马上显示""小李修改于10:23""。这点其他工具都没有新富策略,录咖和录音转文字助手的文件只能自己存本地,要分享还得导出PDF发邮件。AssemblyAI虽然能分享链接,但别人改了我看不到,相当于只能各改各的,最后还得手动合并。
数据说话才实在。准确率方面,我从四种场景录音里各抽1000字核对。听脑AI平均准确率98%,最高的是会议录音,99.2%,就错了8个字;最低的是嘈杂环境,96.5%。录咖平均85%,AssemblyAI 88%,录音转文字助手最差,82%。尤其嘈杂环境,录音转文字助手错漏差不多20%,好多句子连不成意思。
速度差距也明显。2小时会议录音,听脑AI处理完总共花了7分20秒。AssemblyAI用了15分钟,录咖22分钟,录音转文字助手更慢,35分钟才弄完。主要是听脑AI是边录边处理的,会议结束基本就好了,其他都是事后处理,等于多等一倍时间。
功能完整性上,听脑AI确实全。多语言试了英语、日语、粤语。英语刚才说过,97%准;日语是一段5分钟产品介绍,准确率92%,专业词""ノートパソコン""(笔记本电脑)没认错;粤语找同事录的,""呢个方案要返工""这种日常对话,95%能认对。其他三款就局限多了:录咖只有普通话和英语;AssemblyAI多一个西班牙语,但没有粤语;录音转文字助手只有普通话,英语都是半吊子。
存储和同步也得说。听脑AI的文件是存在云端的,我公司电脑上改了记录,回家用手机打开APP,自动同步最新版。另外三款,录咖和录音转文字助手只能存在本地,换电脑就得导文件,麻烦。AssemblyAI虽然有云存储,但同步慢,有次我电脑改了内容,手机等了20分钟才更新,差点误事。
问题也不是没有。听脑AI免费版每月只有3小时转写时长,超出要付费。基础功能98元/月,专业版(带团队协作)199元/月,对个人用户可能有点贵。AssemblyAI界面全英文,设置项特别多,新手得摸索半小时才搞明白怎么用。录咖功能太简单了,除了转文字啥都没有,想标重点、分发言人都不行。录音转文字助手广告太多,打开软件弹三个广告,处理过程中还时不时跳出来,体验很差。对了,AssemblyAI和录咖都不支持方言,上次试了段四川话录音,完全转不出来,听脑AI虽然不是100%准,但80%能看懂大概意思。
选工具还是看你需求。如果是经常开会的上班族,尤其是多人会议,听脑AI的实时转写和发言人区分真的好用,省得会后花1小时整理记录。预算有限的话,偶尔用一次,录音转文字助手免费版也能凑合用,就是广告多,准确率忍忍也行。要是外企主要转英文,AssemblyAI性价比还行,价格是听脑AI的一半,但功能少很多,看你愿不愿意取舍。学生党只转课程录音,录咖基础版68元/月够了,就是别指望太多功能。
话说回来,要是想一个工具搞定所有场景—开会、上课、偶尔外语、甚至带点方言,听脑AI确实是目前最全面的。功能多,但操作不复杂,这点难得。准确率和速度摆在那儿,用过一次就回不去了。当然,要是每月转写时间不到1小时新富策略,随便哪个免费工具都够用,没必要花这个钱。
发布于:广西壮族自治区10倍杠杆配资平台提示:文章来自网络,不代表本站观点。