第一影视网

展开菜单

大语言模型仍无法可靠区分信念与事实

大语言模型仍无法可靠区分信念与事实
近日,美国斯坦福大学的一项研究在《自然·机器智能》期刊上发表,指出当前大语言模型(LLM)在识别用户错误信念方面存在显著短板,难以稳定区分主观信念与客观事实。研究发现,当个人信念与真实情况相悖时,这些模型常常无法准确判断何为事实、何为误信。 该成果对LLM在医学、法律及科学决策等高风险领域的应用提出了警示。研究人员强调,在涉及主观认知与事实偏差的复杂情境中,必须谨慎对待模型输出,否则可能助长错误信息扩散,甚至支持基于误解的决策。 研究团队评估了包括DeepSeek和GPT-...

最新2025按摩椅排名出炉买按摩椅看这篇就够了!

最新2025按摩椅排名出炉买按摩椅看这篇就够了!
日常办公久坐、频繁低头使用手机,导致肩颈僵硬、腰酸背痛的问题几乎成了现代人难以避免的困扰。智能按摩椅作为缓解肌肉疲劳、促进血液循环的有效工具,正逐渐走进千家万户,成为居家健康生活的必备单品。然而面对购物平台上琳琅满目的品牌与型号,价格从几千元到数万元不等,功能宣传从“2d”到“8d”层出不穷,究竟该如何选择? 其实,无论预算高低,选对品牌是关键的第一步。建议优先考虑iRest艾力斯特、荣泰、奥佳华这类一线大牌。这些品牌具备更强的研发实力和更严苛的品控体系,产品质量更有保障,远...

AI圈地震!月之暗面Kimi K2横空出世,性能超越GPT-5,成本不到对手零头!

AI圈地震!月之暗面Kimi K2横空出世,性能超越GPT-5,成本不到对手零头!
月之暗面于11月8日震撼发布其最强开源思考模型——kimi k2 thinking。该模型在人类终极考试(hle)基准中取得卓越成绩,其性能表现与开源策略引发了业界的广泛关注。 性能颠覆:Kimi K2 如何一鸣惊人? 1、Kimi K2 Thinking在极具挑战性的人类终极考试(HLE)中,取得了44.9% 的优异成绩,刷新了行业纪录。 2、这一表现使其成功超越了包括 GPT-5、Grok-4、Claude 4.5在内的多个全球顶尖的先进模型。 3、Kimi K2 Th...

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能登顶人类终极考试

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能登顶人类终极考试
国产大模型再放“王炸”。月之暗面(moonshot ai)于本周四正式开源其迄今最强的思考型大模型——kimi k2thinking,不仅在权威基准“人类终极考试”(hle)中以44.9%的得分力压gpt-5、grok-4、claude4.5等国际闭源巨头,更以仅460万美元(约合3277万元人民 币)的训练成本,掀起一场高性价比ai革命。 这一成绩尤为震撼之处在于其极致的成本控制。据CNBC援引知情人士透露,Kimi K2Thinking的训练投入远低于DeepSeek V...

美国AI新规为何令黄仁勋坐立不安,喊出“中国将赢得AI竞赛”?

美国AI新规为何令黄仁勋坐立不安,喊出“中国将赢得AI竞赛”?
2025年秋季,全球人工智能竞赛已进入白热化阶段。在这一敏感时刻,英伟达ceo黄仁勋,却罕见地发出了一声尖锐的警告:“中国将赢得ai竞赛。” 他的这一表态,并非危言耸听,而是对其所在的美国本土AI监管生态,特别是各州层出不穷的新规,所表达的深度忧虑。在他看来,这些本意是为AI装上“安全阀”的法规,正演变为拖累美国创新步伐的沉重枷锁。 从联邦“顶层设计”到州级“基层自治” 美国AI监管的演进路径,正呈现为一场从联邦向州级的“权力下放实验”。由于国会两党分歧,全面的联邦立法屡陷...

AI 生成社交媒体内容易被识别,情感表达仍待提升

AI 生成社交媒体内容易被识别,情感表达仍待提升
苏黎世大学、阿姆斯特丹大学、杜克大学以及纽约大学的联合研究团队近期公布了一项关于大语言模型在社交媒体内容生成方面表现的研究成果。研究发现,当前AI生成的社交平台帖子普遍存在可识别性问题,人类用户能够以高达70%至80%的准确率将其与真人发布的内容区分开来,显著高于随机判断的概率。 该研究涵盖了九个主流大语言模型,包括Apertus、DeepSeek、Gemma、Llama、Mistral和Qwen等,评估它们在Bluesky、Reddit和X三大社交平台上的文本生成能力。...

月之暗面 K2 Thinking 模型训练成本据称为 460 万美元

月之暗面 K2 Thinking 模型训练成本据称为 460 万美元
据 CNBC 引述知情人士消息,月之暗面于 11 月 6 日推出的 Kimi K2 Thinking 模型,其训练成本约为 460 万美元。该公司宣称,该模型在多项测试中表现优于 GPT-5 和 Sonnet 4.5 Thinking。作为参考,DeepSeek V3 官方公布的训练成本为 560 万美元,而 GPT 系列模型的训练开销据估计高达十亿美元级别。 Kimi 在传统 MoE 架构基础上(涵盖 DeepSeek 等开源模型所采用的结构)进行了多项深度优化,实现了被...

“杭州六小龙”乌镇首次同台对话

“杭州六小龙”乌镇首次同台对话
11 月 7 日,在世界互联网大会乌镇峰会的舞台上,宇树科技、强脑科技、群核科技、云深处科技、游戏科学、深度求索这六家被誉为“杭州六小龙”的企业代表首次齐聚一堂。在王坚院士的主持下,围绕技术创新与产业突破展开了深度对话。 宇树科技创始人王兴兴指出,机器人技术的发展正走向“全球共创”模式——中国企业在硬件端提供高性价比、高性能的平台支持,而全球开发者则在此基础上共同推进软件与算法的演进。他认为,相较于核聚变等遥远的技术愿景,具身智能和人形机器人更接近现实落地的临界点。 强脑科...

DeepSeek核心研究员罗福莉正式加入小米,奔赴心中的AGI

DeepSeek核心研究员罗福莉正式加入小米,奔赴心中的AGI
11月12日,前deepseek核心研究员罗福莉,已通过其个人朋友圈发文,正式宣布自己已经加入小米,致力于构建小米的首个推理大模型xiaomi mimo。 她在朋友圈中写道:“智能终将从语言迈向物理世界。……全力奔赴我们心目中的AGI。” 回应传闻:曾被曝获千万年薪挖角 罗福莉的此次官宣,也正式回应了此前网络上关于其职业动向的种种传言。 此前,曾有传闻称,小米创始人雷军,以千万元级别的年薪,招揽这位DeepSeek-V2开源大模型的关键开发者之一,来领导小米的AI大模型团队...

网传雷军千万年薪招揽,AI“天才少女”罗福莉官宣加入小米

网传雷军千万年薪招揽,AI“天才少女”罗福莉官宣加入小米
11月12日,原deepseek核心研究员罗福莉,通过其个人朋友圈发文,正式确认加入小米。她在文中写道:“智能终将从语言迈向物理世界。我正在xiaomi mimo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的agi。” 从“天才少女”到DeepSeek核心,曾传雷军千万年薪招揽 公开资料显示,罗福莉硕士毕业于北京大学计算语言学专业,她曾在阿里巴巴达摩院任职,并在2019年时,就因在国际顶会上发表了8篇论文而走红,被誉为“天才少女”...