*此内容由AI翻译生成。

KT5日表示,自主开发的超大型AI模型"相信:音K"在综合评价全球AI模型性能的平台"AAII(Artificial Analysis Intelligence Index)"中,在国内中小型模型中位居第一。
AII是由AI评价专门机构Artificial Analysis运营的全球评价平台。 全世界主要AI模型的性能不是单一试验,而是综合多数公开基准结果,向用户提供客观可靠的AI模型信息。 国内主要AI模型LG Exaone、Naver Hyper Clova、Upstage Solar、Motif等也一同被登载,宣传韩国的AI竞争力。
此次评价中,相信:音K在推论、专业知识、数学编程、代理执行能力等10多个核心评价项目中,整体上取得了优秀的分数。 对此,KT强调说:"相信:UMK不仅回答了用户的提问,还客观地证明了作为理解目标后,自己利用必要的系统或工具完成任务的代理性AI,具备了全球竞争力。"
在此次AII公开结果中,"相信:嗯K"在主要代理性能基准之一的"τ²-bench(Tau Square Bench)"中获得了87%的记录,成为了代理AI领域的最佳模型。 τ²-bench是评价AI在实际业务环境下与人合作,能否利用各种工具将任务进行到底的经纪人特殊基准。 KT表示:"相信:音K记录的数值是最高水平,与谷歌的最新机型'杰米奈3'并驾齐驱。"
相信:嗯K除了代理性指标外,在评价专业知识和高难度推论能力的MMLU Pro、GPQA、HLE等主要基准测试中也均取得了优秀的成绩。 特别是在韩语理解性能指标上达到了国内最高水平。 这些成果在参数40B(400亿个)以下的子模型中得到体现,这一点更加值得关注。 在减轻大规模GPU基础设施负担、提高效率的同时,准确理解用户复杂指示的"指示履行能力"和完美理解韩国固有文脉及社会脉络的"韩国特色性能"都确保了最高水平的性能。
KT表示,通过直接执行从模型架构设计到学习数据构建的全过程的"from scratch"方式,实现了"相信:嗯K",创造了最适合韩国企业环境的最具韩国特色的AI。 实际上,相信:嗯K的设计可以应对报告书制作、文件摘要、数据分析、顾客接待等实务现场可以立即使用的多种剧本。
KT计划将"相信:音K"正式推广为最适合国内B2B市场的"代理AI"模式。 其战略是,根据金融、公共、制造等各产业,提供企业实际业务自动化、自行判断和处理的定制型AI代理,引导企业顾客的AI转换(AX)。
KT技术革新部门负责人(副社长)吴承弼(音)表示:"此次AII的申遗客观上证明了KT自身的AI技术力达到了全球标准","将通过Agentic AI,成为引领韩国企业业务革新和数字转换的最佳AI合作伙伴"
© STARNEWS. 未经许可禁止转载或再分发
*此内容由AI翻译生成。
![[丧帖] 全仁烨的母亲去世](https://menu.mt.co.kr/cdn-cgi/image/f=auto,w=271,h=188,fit=cover,g=face/starnews24/static/images/default_article.png)


![《洪明甫三后卫咒语》中金文焕确信"国家队边锋? 即使要求不同,只要认知到作用,就没有问题" [上岩现场]](https://image.starnewskorea.com/cdn-cgi/image/f=auto,w=567,h=378,fit=cover,g=face/21/2026/04/2026041902113594296_4.jpg)

![《2891天的等待》再次站在冠军面前,权成烈:"越迫切越不行,对健康打球感到很满足" [春川县长]](https://image.starnewskorea.com/cdn-cgi/image/f=auto,w=567,h=378,fit=cover,g=face/21/2026/04/2026041812582251050_1.jpg)






