You can view this site in English. Please check the list of supported languages.

* Translated by Papago

Starnews

KT AI"相信:音K"在全球AI指标中位居国内型号第一

发布 :

Kim Heyrim

*此内容由AI翻译生成。

KT5日表示,自主开发的超大型AI模型"相信:音K"在综合评价全球AI模型性能的平台"AAII(Artificial Analysis Intelligence Index)"中,在国内中小型模型中位居第一。

AII是由AI评价专门机构Artificial Analysis运营的全球评价平台。 全世界主要AI模型的性能不是单一试验,而是综合多数公开基准结果,向用户提供客观可靠的AI模型信息。 国内主要AI模型LG Exaone、Naver Hyper Clova、Upstage Solar、Motif等也一同被登载,宣传韩国的AI竞争力。

此次评价中,相信:音K在推论、专业知识、数学编程、代理执行能力等10多个核心评价项目中,整体上取得了优秀的分数。 对此,KT强调说:"相信:UMK不仅回答了用户的提问,还客观地证明了作为理解目标后,自己利用必要的系统或工具完成任务的代理性AI,具备了全球竞争力。"

在此次AII公开结果中,"相信:嗯K"在主要代理性能基准之一的"τ²-bench(Tau Square Bench)"中获得了87%的记录,成为了代理AI领域的最佳模型。 τ²-bench是评价AI在实际业务环境下与人合作,能否利用各种工具将任务进行到底的经纪人特殊基准。 KT表示:"相信:音K记录的数值是最高水平,与谷歌的最新机型'杰米奈3'并驾齐驱。"

相信:嗯K除了代理性指标外,在评价专业知识和高难度推论能力的MMLU Pro、GPQA、HLE等主要基准测试中也均取得了优秀的成绩。 特别是在韩语理解性能指标上达到了国内最高水平。 这些成果在参数40B(400亿个)以下的子模型中得到体现,这一点更加值得关注。 在减轻大规模GPU基础设施负担、提高效率的同时,准确理解用户复杂指示的"指示履行能力"和完美理解韩国固有文脉及社会脉络的"韩国特色性能"都确保了最高水平的性能。

KT表示,通过直接执行从模型架构设计到学习数据构建的全过程的"from scratch"方式,实现了"相信:嗯K",创造了最适合韩国企业环境的最具韩国特色的AI。 实际上,相信:嗯K的设计可以应对报告书制作、文件摘要、数据分析、顾客接待等实务现场可以立即使用的多种剧本。

KT计划将"相信:音K"正式推广为最适合国内B2B市场的"代理AI"模式。 其战略是,根据金融、公共、制造等各产业,提供企业实际业务自动化、自行判断和处理的定制型AI代理,引导企业顾客的AI转换(AX)。

KT技术革新部门负责人(副社长)吴承弼(音)表示:"此次AII的申遗客观上证明了KT自身的AI技术力达到了全球标准","将通过Agentic AI,成为引领韩国企业业务革新和数字转换的最佳AI合作伙伴"

© STARNEWS. 未经许可禁止转载或再分发

*此内容由AI翻译生成。

推荐新闻

日刊热搜新闻

编辑精选

商业·生活最新

AD