国产模型评测结果:
代码能力:通义千问2.5 > 文心一言4.0 >> 抖音豆包
绘画能力:抖音豆包 >> 文心一言 ≈ 通义千问2.5(后两者限制多的离谱,画个女人就要掐,默认就嗯出国风古装女)
聊天能力:抖音豆包 > 通义千问2.5 > 文心一言4.0(同样是限制太多,又没见证又没骂人就是拒绝)
最终总结:
通义千问适合工作学习,专业能力非常强,纠错能力趋近于Bing AI,知识库和搜索内容比百度优质得多,中文输出能力远比GPT4好,作业能力不输GPT4,别杠,也算是体验很久GPT4了,知道GPT4水准,相比之下就是慢了许多。
🥵抖音豆包适合聊天和日常辅助,绘画能力断层式遥遥领先,语音够烧,说话尺度也是有的,可玩性很高,APP界面也是最清爽简洁的,限制应该是三家最松的。
文心一言4.0实在想不出充钱的理由,搜索知识库全是百度垃圾场,代码能力还算可以,纠错能力一坨,绘画一般,应用界面一股百度味儿,试用期结束就丢弃
- 本文作者: Phquathi
- 本文链接: http://phquathi.github.io/pHq-blog/2024/06/05/国产大模型评测/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!