海量新闻最新最快最多设为首页收藏本站我的收藏按 Ctrl+D收藏本站

XinWen无线 - XinWen.Mobi»XinWen无线 › 新闻 › 海量 ›

Claude 4发布，能连轴转编程7小时，力压GPT-4.1 ...

日产讴歌福特极氪林肯阿尔法保时捷奔腾长城东风哈弗 Jeep 捷途岚图理想兰博基尼名爵马自达玛莎拉蒂欧拉奇瑞 smart 沙龙坦克特斯拉蔚来沃尔沃小鹏雪佛兰高合奥迪丰田本田雷克萨斯英菲尼迪捷达捷豹路虎阿斯顿马丁罗密欧标致宾利长安法拉利红旗几何凯迪拉克领克劳斯莱斯路特斯 MINI 迈凯伦哪吒起亚荣威三菱斯巴鲁腾势魏牌五菱现代雪铁龙宝骏大众宝马比亚迪

返回列表发新帖

Claude 4发布，能连轴转编程7小时，力压GPT-4.1

[XinWen.Mobi 原创复制链接分享]

xinwen.mobi 发表于 2025-5-24 08:45:27 | 显示全部楼层 |阅读模式

▶ 语音朗读

北京时间2025年5月23日，Anthropic公司发布了Claude 4系列大模型，包含Claude Opus 4和Claude Sonnet 4两个版本。其中Claude Opus 4能连轴转编程7小时，在多项编程测试中表现优于GPT-4.1，展现出了强大的性能。具体如下：长时间编程能力：Claude Opus 4在Rakuten的测试数据中，凭借改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制，可在软件环境中连续进行近7小时的代码生成和任务执行，刷新了AI世界纪录，远超前代Claude 3 Opus的不到1小时，也领先于其他同类模型。编程基准测试成绩：在用于评估模型解决真实GitHub问题能力的SWE - bench基准测试中，Claude Opus 4准确率高达72.5%，而GPT-4.1仅为54.6%。在针对多步骤终端代码生成任务验证模型表现的TerminalBench测试里，Claude Opus 4准确率达到43.2%，也展现出了优秀的编程能力。此外，Claude Sonnet 4取代了前代Claude 3.5 Sonnet，在架构上更为稳定，虽推理能力不及Opus 4，但支持多文件代码导航等功能，且延迟表现更佳，在SWE - bench基准测试中也取得了72.7%的高分，表现较为出色。

Claude, Opus, 测试, 编程, 表现

相关帖子

回复

使用道具举报

返回列表发新帖

07'48'' 人形机器人走入千家万户还要多久？
喜欢: 0 回复: 0
最后一个电车免税的“金九银十”！近40款新车扎堆上市
喜欢: 0 回复: 0
用脑波踢足球 VR体验消防救援科普原来可以如此有趣
喜欢: 0 回复: 0
孙文西路步行街灯影花
喜欢: 0 回复: 0
该剧将于9月29日至10月5日在上海上剧场演出！
喜欢: 0 回复: 0
AI赋能第22届东博会大批“硬核科技”亮相
喜欢: 0 回复: 0
河北昌黎：海上光伏项目建设忙
喜欢: 0 回复: 0
会里会外看东博会：一碗粉销万里
喜欢: 0 回复: 0
泉州:公交候车亭"颜值""功能"双升级
喜欢: 0 回复: 0
财政部：1—8月国有土地使用权出让收入同比下降4.7%
喜欢: 0 回复: 0
推进乡村教育现代化体育不是“点缀”
喜欢: 0 回复: 0
扩大服务消费将打出政策“组合拳”
喜欢: 0 回复: 0
国庆中秋长假临近，假期旅游市场迎来预订高峰
喜欢: 0 回复: 0
卖祖求荣卖祖求荣
喜欢: 0 回复: 0
巴铁的“核保护伞”能罩住沙特吗中东新盟约背后的考量
喜欢: 0 回复: 0
日本为何拒绝对华加税基于规则的拒绝
喜欢: 0 回复: 0
沈阳举行“勿忘九一八”撞钟鸣警仪式
喜欢: 0 回复: 0
金秋里，听历史的声息拂过耳畔
喜欢: 0 回复: 0
多图！歼-20在长春首次静态展示
喜欢: 0 回复: 0
来自5000年前的“表情包”
喜欢: 0 回复: 0
两岸艺术家在渝共抒翰墨情
喜欢: 0 回复: 0
海峡两岸青年逐梦重庆就业创业研讨会举行
喜欢: 0 回复: 0
第五届粤港澳大湾区文化艺术节在广州开幕
喜欢: 0 回复: 0
香港商界：以实际行动推动经济高质量发展与民生改善
喜欢: 0 回复: 0
李家超：新一份施政报告体现更全面的“改革加部署”
喜欢: 0 回复: 0
淋巴瘤诊疗加速突破：创新药与规范诊疗共筑健康防线
喜欢: 0 回复: 0
中外媒体聚焦宁夏探寻发展新动能
喜欢: 0 回复: 0
吉林推动碳足迹管理绿色转型提升产品竞争力
喜欢: 0 回复: 0
中国—东盟自贸区3.0重塑区域经济格局
喜欢: 0 回复: 0
“无语哥”到底是谁？从失业工人到世界第二大网红
喜欢: 0 回复: 0
海南三亚：晚稻田园景如画
喜欢: 0 回复: 0
来宾武宣：靶向服务激活企业创新动能
喜欢: 0 回复: 0
体育嘉年华走进城市商圈，市民“迈开步”“动出彩”
喜欢: 0 回复: 0
中国—东盟国家海洋药物与生物制品研讨会在南宁举行
喜欢: 0 回复: 0
品好物、促振兴，这场展销活动把乡村味道搬进机关
喜欢: 0 回复: 0
第22届中国—东盟博览会进境展品全部运抵南宁
喜欢: 0 回复: 0
探营第22届东博会人工智能专馆，众多AI成果将亮相
喜欢: 0 回复: 0
广西部署开展“暖心民政”三年行动
喜欢: 0 回复: 0
8月各线城市商品住宅售价同比降幅总体继续收窄
喜欢: 0 回复: 0
外卖大战，战而不休为哪般？
喜欢: 0 回复: 0
乌军方称对俄罗斯大型炼油厂发动袭击
喜欢: 0 回复: 0
这个新建社区有着浓浓的邻里温情
喜欢: 0 回复: 0
温州港开通中东国际航线
喜欢: 0 回复: 0
“再不讲，年轻人更不会知道这段历史”
喜欢: 0 回复: 0
HPV疫苗，能免费接种了
喜欢: 0 回复: 0
这所新大学，一周只上四天课
喜欢: 0 回复: 0
中行行大运，金彩大运金
喜欢: 0 回复: 0
南昌往返澳门国产飞机C909首条地区航线开通
喜欢: 0 回复: 0
香港馆连续12届亮相服贸会，搭建内地企业“出海”通道
喜欢: 0 回复: 0
全球水产从广州“游”向世界！“渔业广交会”在海珠开幕
喜欢: 0 回复: 0
夜探服贸会“首钢小镇”
喜欢: 0 回复: 0
广东旅博会创新搭台让企业与英才精准“对上眼”
喜欢: 0 回复: 0
半年报创新高的海天味业还不能高兴太早
喜欢: 0 回复: 0
十一：搜索热度接近翻倍欧洲城市深度行受宠
喜欢: 0 回复: 0
中国智能辅助驾驶方案加速进入国际赛道
喜欢: 0 回复: 0
30岁出头！歼-35研发人员好年轻创新设计引领未来
喜欢: 0 回复: 0
中东看清“美国保护”真相盟友安全成代价
喜欢: 0 回复: 0
普京授予梅德韦杰夫祖国功绩勋章表彰其巨大贡献
喜欢: 0 回复: 0
罗永浩谈西贝与预制菜
喜欢: 0 回复: 0
服贸会上的文旅“新”体验
喜欢: 0 回复: 0
各地秋粮生产有序推进
喜欢: 0 回复: 0
苹果华为“神仙打架”！A股消费电子板块迎来“爆发时刻”
喜欢: 0 回复: 0
欧盟拟用“迄今最强硬”措施制裁以色列
喜欢: 0 回复: 0
1,700-year-old village preserves captivating charm
喜欢: 0 回复: 0
博物馆里的台湾实习生：一场跨越千年的“邂逅”
喜欢: 0 回复: 0
36家台企亮相服贸会共享大陆发展机遇
喜欢: 0 回复: 0
“香江国粹情——2025中国京剧艺术基金会香港行”揭幕
喜欢: 0 回复: 0
香港新一届十大杰出大专学生出炉
喜欢: 0 回复: 0
中国外交部：欢迎各国人才来港安居乐业、大展宏图
喜欢: 0 回复: 0
9月12日央行开展2300亿元7天期逆回购操作
喜欢: 0 回复: 0
放开限购、取消限售……这些地方的楼市新政已落地
喜欢: 0 回复: 0
过去4年我国对世界经济增长贡献率保持在30%左右
喜欢: 0 回复: 0
贵州黔西：水稻开镰收割
喜欢: 0 回复: 0
第十二批在韩中国人民志愿军烈士遗骸回国
喜欢: 0 回复: 0
渤海亿吨级油田又一油气平台完成海上安装
喜欢: 0 回复: 0
“南充造”出海再提速四川南充的开放故事这样写
喜欢: 0 回复: 0
入境游“流量”变“留量”，亟需外语导游“当红娘”
喜欢: 0 回复: 0
来宾交警“三招”出击跨区域整治护出行安全
喜欢: 0 回复: 0
官宣！凭东博会证件，享南宁全城折扣！
喜欢: 0 回复: 0
关注！东盟国家在人工智能领域的需求有这些方面
喜欢: 0 回复: 0
5个首次！2025环广西世巡赛将有这些创新→
喜欢: 0 回复: 0
英国伦敦地铁罢工持续市长呼吁骑车出行
喜欢: 0 回复: 0
遗产保护用上黑科技在峨眉山解锁文旅新体验
喜欢: 0 回复: 0
翻了2小时录像，街头救人的杭州姑娘找到了！
喜欢: 0 回复: 0
顶级球员，拿不到顶薪
喜欢: 0 回复: 0
“红发女副首相”，塌房了
喜欢: 0 回复: 0
光伏产业“反内卷”，国家出手了
喜欢: 0 回复: 0
王树国：福耀科大不想培养“乖孩子”
喜欢: 0 回复: 0
近3万件数据知识产权助力数字经济发展
喜欢: 0 回复: 0
理光中国研究院在ACL 2025竞赛中再次斩获冠军
喜欢: 0 回复: 0
重大突破！比亚迪引领欧洲新能源市场
喜欢: 0 回复: 0
联想携手海影节，以AI技术重塑电影创作未来
喜欢: 0 回复: 0
更顺手更可靠佳能EOS R1 Ver1.1.2固件体验评测
喜欢: 0 回复: 0
11:49 冰箱彩电智驾标配魏牌高山7好开还全能
喜欢: 0 回复: 0
环球影业添加 “禁止用于 AI” 声明Jj资讯
喜欢: 0 回复: 0
苹果iPhone 17 Air居然支持双eSIM！Lin资讯
喜欢: 0 回复: 0
谁是下一任法国总理？马克龙的选项越来越少
喜欢: 0 回复: 0
苹果发布会前瞻：iPhone要变轻薄？国行AI或继续缺位
喜欢: 0 回复: 0
工信部部长发声：绝不容忍非理性竞争毁掉一个企业
喜欢: 0 回复: 0
公募销售费改重塑行业生态
喜欢: 0 回复: 0

|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-10-28 15:28 , Processed in 0.091678 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表