2023/05/22 14:00
東京工業大や富士通などのチームが今月、日本語能力の高い生成AI(人工知能)の基盤技術の開発に乗り出す。国産の生成AIを開発し、国際競争力の強化につなげる狙いがある。一方、専門家からは、著作権侵害などの問題への対処や開発過程の透明化を求める指摘もある。
米オープンAIによる対話型サービス「チャットGPT」に代表される生成AIは、AIの訓練にインターネット上の英語の文章が多く使われている。そのため、日本語の精度が英語より低いことが課題だった。
チームには東工大や富士通のほか、東北大、理化学研究所などAI研究で日本を代表する研究機関や企業が結集した。開発するのは、「大規模言語モデル」と呼ばれる生成AIの基盤技術。グーグルが2017年に開発した言語学習手法を使い、ネット上にある大量の日本語の文書データをAIに読み込ませる。
AIを訓練して性能を高めるには膨大な計算が必要になるため、スーパーコンピューター「富岳」を使い、比較的短期間での開発を狙う。開発した基盤技術は今年度内に公開し、国産の生成AIの開発や商用サービスへの利用につなげる。
生成AIには、個人情報の漏えいや著作権の問題などが指摘されている。チームの坂口慶祐・東北大准教授(情報科学)は「米国の一部の企業だけが技術を持つ状況は好ましくない。様々な課題に対処するためにも日本が技術を持っておくことが重要だ」と話す。
AI開発に詳しい松原仁・東京大教授の話「生成AIが社会を変えると言われる中、国産の技術を持つのは適切だ。一方、著作権侵害の懸念などもあり、開発の目的や 進捗しんちょく を丁寧に説明することが求められる」
2023/05/22 14:00
도쿄 공업대나 후지쯔등의 팀이 이번 달, 일본어 능력이 높은 생성 AI(인공지능)의 기반기술의 개발에 나선다.국산의 생성 AI를 개발해, 국제 경쟁력의 강화에 연결하는 목적이 있다.한편, 전문가에게서는, 저작권 침해등의 문제에의 대처나 개발 과정의 투명화를 요구하는 지적도 있다.
미 오픈 AI에 의한 대화형 서비스 「채팅 GPT」로 대표되는 생성 AI는, AI의 훈련에 인터넷상의 영어의 문장이 많이 사용되고 있다.그 때문에, 일본어의 정도가 영어보다 낮은 것이 과제였다.
팀에는 동쪽 공대나 후지쯔외, 토호쿠대, 이화학 연구소 등 AI연구로 일본을 대표하는 연구기관이나 기업이 결집했다.개발하는 것은, 「대규모 언어 모델」이라고 불리는 생성 AI의 기반기술.굿 한패가 2017년에 개발한 언어학습수법을 사용해, 넷상에 있는 대량의 일본어의 문서 데이터를 AI에 읽어들이게 한다.
AI를 훈련하고 성능을 높이려면 방대한 계산이 필요하게 되기 위해, 슈퍼 컴퓨터 「부악」을 사용해, 비교적 단기간으로의 개발을 노린다.개발한 기반기술은 금년도내에 공개해, 국산의 생성 AI의 개발이나 상용 서비스에의 이용에 연결한다.
생성 AI에는, 개인정보의 누설이나 저작권의 문제등이 지적되고 있다.팀의 사카구치 케이우·토호쿠대준교수(정보과학)는 「미국의 일부의 기업만이 기술을 가지는 상황은 바람직하지 않다.님 들인 과제에 대처하기 위해서도 일본이 기술을 가져 두는 것이 중요하다」라고 이야기한다.
?``I개발을 잘 아는 마츠바라 진·도쿄대교수의 이야기 「생성 AI가 사회를 바꾼다고 말해지는 중, 국산의 기술을 가지는 것은 적절하다.한편, 저작권 침해의 염려등도 있어, 개발의 목적이나 진척 진척을 정중하게 설명하는 것이 구할 수 있다」