报告称谷歌搜索 AI 概览准确率约 90%,易被虚假信息操纵

fmt

谷歌AI概览准确性存隐忧:高准确率下的大量错误与操纵风险

核心报道:高准确率背后的海量错误

《纽约时报》报道称,谷歌AI概览(AI Overviews)的准确率约为90%,但基于其每年超5万亿次的搜索量,每小时可能产生超过5700万条错误答案,每分钟近100万条。这一数据凸显了“高准确率”与“高错误总量”的矛盾——因搜索基数庞大,即使低错误率也会导致海量误导性内容。

测试数据:准确率提升但问题比例恶化

AI初创公司Oumi通过SimpleQA基准评估谷歌搜索(分析4326次搜索)发现,AI概览准确率从Gemini 2时期的85%提升至Gemini 3的91%,但问题同步显现:

  • 与来源不符比例上升:从Gemini 2的37%升至Gemini 3的56%,具体表现为“错误概览后紧跟正确链接”或“准确概览引用错误信息”;
  • 易被虚假信息操纵:有记者发布虚假博客后,谷歌次日便在AI概览中引用该内容,显示生成内容存在被恶意注入的风险。

用户案例:自相矛盾引发信任危机

用户斯蒂芬·潘瓦西查询摔跤手胡克·霍根(Hulk Hogan)死讯时,AI概览明确回复“没有可信报告显示霍根已去世”,但页面下方文章标题却写着“霍根之死谜团加深”,自相矛盾的内容引发了用户对AI生成信息可靠性的质疑

谷歌反驳:测试方法存局限

谷歌发言人质疑Oumi的测试方法,认为其未能反映真实搜索行为,暗示测试结果存在偏差,无法全面代表实际搜索场景中的AI概览表现。

总结

尽管谷歌AI概览准确率有所提升(从Gemini 2的85%到Gemini 3的91%),但其“高错误总量”“与来源不符比例上升”“易被虚假信息操纵”等问题不容忽视。用户案例与研究人员发现的矛盾现象,进一步暴露了AI生成内容在准确性和可靠性上的隐忧。

(注:文中数据与案例来自《纽约时报》及Oumi测试报告,谷歌方面对测试方法提出质疑。) fmt 一站式数字化解决方案服务商 —— 专业提供软件开发、网站设计、APP 与小程序开发,搭载低费率支付通道,结合创意广告设计,助力企业全链路数字化升级。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部