You can view this site in English. Please check the list of supported languages.

* Translated by Papago

Starnews

KT AI「信頼:音K」、グローバルAI指標で国内モデルの中で「1位」

公開日 :

Kim Heyrim

*このコンテンツはAIによって翻訳されました。

KTは5日、独自開発した超巨大AIモデル「MIDO:MIDO:K」がグローバルAIモデル性能を総合評価するプラットフォーム「AII(Artificial Analysis Intelligence Index)」で国内中小型モデルの中で1位を達成したと明らかにした。

AAIIはAI評価専門機関であるアーティフィシャル·アナリシス(Artificial Analysis)が運営するグローバル評価プラットフォームだ。 全世界の主要AIモデルの性能を単一試験ではなく、多数の公開ベンチマーク結果を総合し、ユーザーに客観的で信頼性のあるAIモデル情報を提供する。 国内主要AIモデルのLGエクサウォン、ネイバーのハイパークローバー、アップステージのソーラー、モチーフなども一緒に登載され、韓国のAI競争力を知らせている。

今回の評価で信じる:音Kは推論、専門知識、数学·プログラミング、エージェント遂行能力など10ヶ余りの核心評価項目で全般的に優秀な点数を記録した。 これについてKTは、「信じて:うーん、Kがユーザーの質問に答えるのに止まらず、目標を理解した後、必要なシステムやツールを自ら活用して課業を果たすエイジェンティックAIとしてグローバル競争力を備えていることを客観的に立証したものだ」と強調した。

今回のAAII公開の結果で、Modi:Kは主要エージェント性能ベンチマークの一つである「τ²-bench(タウスクエアベンチ)」で87%を記録し、AgenticAI分野のトップモデルとして名前を上げた。 τ²-benchはAIが実際の業務環境で人と協業し、さまざまなツールを活用して課題を最後まで遂行できるかを評価するエージェント特化ベンチマークだ。 KTは、「信じる:うーん、Kが記録した数値はトップレベルであり、グーグルの最新モデルである『ジェミナイ3』とも肩を並べている」と明らかにした。

信じる:うーん、Kは、エージェントティック指標の他にも、専門知識と高難度推論能力を評価するMMLUプロ、GPQA、HLEなど、主要ベンチマークでも均等に優秀な成績を収めた。 特に、韓国語理解性能指標では、国内最高水準を達成した。 このような成果は、媒介変数40B(400億個)以下級モデルで実現されたという点で、さらに注目に値する。 大規模GPUインフラの負担を減らし効率性を高めながらも、ユーザーの複雑な指示を正確に理解する「指示履行能力」と韓国固有の文脈および社会的脈絡を完璧に理解する「韓国特化性能」まで全て最高水準の性能を確保した。

KTはモデルアーキテクチャ設計から学習データの構築まで全過程を直接遂行する「フロムスクラッチ」方式で信じる:音Kを具現し韓国企業環境に最適化された最も韓国的なAIを作り出したと伝えた。 実際、信じる:うーん、Kは報告書作成、文書要約、データ分析、顧客応対など実務現場で直ちに活用できる多様なシナリオに対応できるように設計された。

KTは、「信心:音K」を国内B2B市場に最適化した「エイジェンティックAI」モデルに本格的に拡散する計画だ。 金融·公共·製造など産業別に企業の実際業務を自動化し自ら判断して処理するオーダーメード型AIエージェントを提供し、企業顧客のAI転換(AX)を先導するという戦略だ。

KTのオ·スンピル技術革新部門長(副社長)は「今回のAAII登載はKTの自主AI技術力がグローバル基準に到達したことを客観的に立証した成果」として「エージェンシーティックAIを通じて韓国企業の業務革新とデジタル転換を導く最高のAIパートナーになる」と話した。

© STARNEWS. 無断転載・再配布禁止

*このコンテンツはAIによって翻訳されました。

おすすめニュース

日刊急上昇

編集部おすすめ

ビジネス・ライフ最新ニュース

AD