用AI写报告,大量内容胡编乱造!德勤向澳洲政府退钱(图)

《澳洲金融评论报》报道称,德勤为澳洲政府撰写报告时使用了生成式AI,而AI则在报告中引用了根本不存在的信息源,同时捏造了联邦法院的判词。

澳洲政府为这份报告向德勤支付了44万澳元,事件曝光后,德勤已退还部分费用。



报道称,该报告由德勤为工作场所关系部(Department of Workplace Relations,DEWR)撰写,具体内容为福利系统中自动执行处罚(如暂停失业救济金),首个版本于7月对外公布。

不到1个月后,德勤就被迫展开内部调查,因为悉尼大学的学者Christopher Rudge在该报告中发现了多个错误。

Rudge一开始便猜测,报告中的错误是由“AI错觉”所导致的——因为很多引用都是捏造的,德勤当时拒绝对此作出回应。

而在上周五,修改后的报告被重新上传至工作场所关系部的官网。新版报告删除了10多条不存在的引用和注释,重写了参考文献列表,并更正了多个排版错误。



(图片来源:《澳洲金融评论报》)

《澳洲金融评论报》报道称,这一事件令德勤颇为尴尬,在该公司每年1070亿澳元的收入中,为客户和高管提供AI咨询与培训的比例越来越大。

德勤曾宣称,会在全球业务中广泛使用AI技术,但始终由人类对AI输出进行审查。

新版本报告在方法论部分承认,生成式AI被用于公司所谓的“可追溯性和文档缺口”环节。

报告现在指出,公司使用了“由DEWR授权并托管在DEWR Azure上的生成式AI语言大模型(Azure OpenAI GPT-4o)工具链”。



Christopher Rudge最早发现了报告中的错误(图片来源:《澳洲金融评论报》)


这一披露再加上已删除错误,使得Rudge得出结论,初版报告的问题源于AI错觉。

Rudge表示:“这不再只是一个‘假设’,德勤已就此事坦白——尽管埋在方法论部分。德勤承认在关键分析任务中使用了生成式AI,但一开始却没有披露这一点。”

这位学者表示,报告的建议已不再可信,因为“核心分析是由AI完成的”。

“当报告的根基建立在一个有缺陷、最初未披露、且缺乏专家参与的方法之上时,你无法信任它的建议。”



德勤在新版报告中删除了大量不存在的信息源(图片来源:《澳洲金融评论报》)

工作场所关系部发言人表示,“独立审查的实质内容被保留,建议没有变化”,但他拒绝回答该部门是否认为这些错误是由AI造成的。

发言人称,德勤已“同意退还合同的最后一笔款项”,但拒绝透露具体金额。

在被问及工作场所关系部是否会继续聘用德勤进行其他工作,或是否会要求全额退款时,发言人也拒绝回应。

自2021年以来,德勤澳洲已与工作场所关系部签订了近2500万澳元的合同。
评论人:独孤苍狼 [♂☆★伪希腊假罗马★☆♂] [个人频道] [个人动态]
应该退还全部付款,并且支付赔偿!
2025年10月05日20:12
评论人:cxy1223 [★品衔R6★] [个人频道] [个人动态]
 回复22楼:德勤作为澳洲政府的打手,给执政联盟做的脏事比给工党做的要多多了。要查他们反对你的可不仅仅是执政的工党。
2025年10月06日3:58
评论人:rally [☆★专治1党★☆] [个人频道] [个人动态]
 回复21楼:众议院150席有10个独立议员,比例很高了。
2025年10月06日2:29
评论人:greentee [☆★声望品衔8★☆] [个人频道] [个人动态]
幻觉是因为,所谓人工智能不过是机械地把关联紧密的词语排在一起。
比如,“美丽的”后面多半会跟上“花朵,女人”等。至于到底接哪个词,机器根据上下文来推断。同时问题也就出在这里,机器并不理解语句的真正含义。在机器看来只是一场概率计算。
2025年10月06日1:15
评论人:大春哥 [☆★声望品衔7★☆] [个人频道] [个人动态]
Ai 論留園可信度
“6park”(留园网 / 留园网论坛 / 留园新闻评论等)是一个成立较早、面向华人社区的综合性中文论坛/新闻平台。 
不过,要评估其“可信度”,需要从多个维度来看。下面是我的分析,以及作为参考时的注意事项:

一、优点与基础可靠性
1. 历史与用户基础
6park 从 2003 年起就运作至今,是较有知名度的海外华人社区之一。 
它在华人圈子里有广泛用户参与(新闻转载、论坛帖子、评论互动等) 
2. 内容来源多样
它经常转载或翻译国内外媒体新闻、观点、评论,也有用户原创或社区内容。 
平台本身在“隐私条款”中也声明:对用户的个人身份信息收集有限制,不主动收集身份证号、家庭住址等敏感信息。 
3. 用户反馈与评价
例如其官方 App 在 Apple App Store 上有评分(评分约 4.1 分 / 5 分)和用户评价。 
这样的用户评价虽不能完全代表内容质量,但至少表明有较活跃用户群体在使用。

二、局限性与风险
虽然 6park 在中文互联网和华人社区中有一定的影响力,但它并不是一个传统意义上的“权威新闻机构”,所以其内容可信度存在局限和风险:
1. 新闻与观点混杂
在 6park 上,经常可以看到新闻报道与评论、观点、社论、用户评论交杂。平台可能不严格区分“新闻事实” 与 “评论性文字” —— 用户在阅读时必须判断哪部分是事实、哪部分是观点。
2. 转载/转发来源不一定审核严密
有时平台转载消息、图片、视频等内容,可能并没有经过严格核实,就可能夹带错误信息、夸张描写或者误导性标题。
3. 社区帖子的真实性不可保证
在论坛、评论区、用户帖中,可能存在谣言、主观臆测、误传、甚至恶意信息(如黑稿、抹黑、带偏见的言论等)。这类内容在任何论坛都可能存在。6park 也不例外。
4. 立场偏向 / 选择性编辑
虽然 6park 宣称收集多方新闻源,但在具体选择哪些新闻、哪个版本、如何配图、配标题、如何编排展现,都会有编辑倾向或偏好。某些议题可能出现倾向性报道或片面呈现。
5. 更新、修正机制不透明
如果平台上某条新闻报道有错误,其是否及时修正、是否做出说明,有时并不透明或不易察觉。

三、怎样判断 6park 的某条内容是否可信
给你几个判断标准或操作建议,帮助你在使用 6park 时分辨可信 vs 可疑内容:
• 查原始来源:如果看到某条新闻或数据,尝试追溯其来源媒体、官方渠道,看是否能在主流或可靠媒体中找到相同报道。
• 多方交叉验证:不要单看 6park 的一个版本,对比国内外不同媒体或官方公告,看看是否一致。
• 注意措辞与语气:带有强烈情绪色彩、夸张、极端措辞的报道可能含有倾向性或偏见。
• 看更新 / 更正记录:如果后来有人指出错误,平台是否有公开说明或更正。
• 注意社区 / 用户帖性质:论坛帖、评论帖,尤其是匿名或热帖,更可能包含主观甚至不实言论。

结论
总的来说,6park 是一个有一定规模、有影响力的中文社区 / 媒体聚合平台,在华人圈子中颇具知名度。它有部分新闻转载与观点性文章,提供了信息参考价值。
但就“新闻真实性 / 权威性”来看,它不能被视作和主流新闻机构(如新华社、BBC、纽约时报等)在同一等级的“可信源”。你在用 6park 的内容时,应当带着批判性、验证意识,不要盲目全信。
2025年10月05日22:27
评论人:ppplu [★皮皮皮鲁★] [个人频道] [个人动态]
这种情况是生成式AI的顽疾。曾经试着让它写一段综述。它引经据典地在文字中间插入了一些文献文章,包括作者,文章标题,期刊名字等很具体的信息。可是一查,全是凭空捏造的。
2025年10月05日22:09
评论人:oldoldcandy [☆★坐路牙吃大瓜★☆] [个人频道] [个人动态]
還是有明眼人..🤣🤣🤣
2025年10月05日22:04
评论人:小曉古今 [★品衔R6★] [个人频道] [个人动态]
 回复3楼:收集到假新聞,或者引用大紀元的數據
2025年10月05日20:55
评论人:灯塔路 [♂★★等着注销★★♂] [个人频道] [个人动态]
没错儿
白虫子
祖传手艺之一:抢偷骗
现在只能白虫子内卷了
2025年10月05日20:36