구글 올림피아드 銀 수준 수학 AI 내놨다
구글 올림피아드 銀 수준 수학 AI 내놨다
전 세계는 원소 경쟁 가장 무거운 원소 제조법 미국이 찾았다
구글의 AI 조직 구글 딥마인드가 25일(현지 시각) 수학 추론에 특화된
인공지능(AI) 모델 알파프루프(AlphaProof)를 출시한다고 밝혔다.
또 올해 초에 선보인 기하학에 초점을 맞춘 AI 모델의 업데이트 버전인 알파지오메트리2(AlphaGeometry2)도 공개했다.
구글 딥마인드는 알파프루프가 올해 국제수학올림피아드(IMO) 기출 문제 6개 중 4개를 풀었다고 밝혔다.
딥마인드는 “이는 은메달 수준의 결과를 얻어낸 것”이라며 “AI가 여전히 어려운 복잡한 수학 문제를 푸는 데 진전을 이뤘다”고 자평했다.
챗 GPT 등 생성형 AI는 빠르게 발전했지만 현재 AI는 의외로 수학 문제를 잘 풀지 못한다.
수학적 명제를 증명하기 위해서는 상당한 추론 능력이 필요하기 때문이다.
기존 컴퓨터는 숫자와 전통적인 계산에 강하지만, 언어로 표현된 수학 문제는 더 복잡한 추론 능력을 요구한다.
때문에 수학 문제 해결은 AI 모델 능력의 중요한 평가 지표가 되고 있다.
구글딥마인드 측은 먼저 시스템이 이해할 수 있도록 문제를 수작업으로 공식적인 수학 언어로 번역했다고 밝혔다.
알파프루프는 두 개의 대수 문제와 한 개의 정수론 문제의 답을 먼저 제시하고, 이 답이 정답임을 증명하는 방식으로 풀이를 이어갔다.
회사 측은 “알파프루프가 맞춘 문제에는 올해 IMO에서 5명만이 풀었던 가장 어려운 문제가 포함됐다”고 밝혔다.
알파프루프는 일부 문제에서 인간을 뛰어넘는 추론력을 보였다.
딥마인드는 “이는 은메달 수준의 결과를 얻어낸 것”이라며 “AI가 여전히 어려운 복잡한 수학 문제를 푸는 데 진전을 이뤘다”고 자평했다.
챗 GPT 등 생성형 AI는 빠르게 발전했지만 현재 AI는 의외로 수학 문제를 잘 풀지 못한다.
수학적 명제를 증명하기 위해서는 상당한 추론 능력이 필요하기 때문이다.
IMO 대회에서 학생들은 4시간, 5시간에 걸친 두 세션 동안 고민 후 답을 제출하는데 알파프루프는 일부 문제를 몇 분 만에 해결했다.
알파기하학2의 경우 지난 25년간 국제 수학 올림피아드에 포함된 모든 기하학 문제의 83%를 풀어냈다.
하지만 한계도 여전한 것으로 나타났다.
6문제 중 2문제에 대해서는 아예 작업을 시작하지도 못한 것이다.
또 정답을 맞춘 한 문제에 대해서는 24시간 내내 작업해 3일이 걸렸다.
수학 AI에 대한 연구는 구글 딥마인드 뿐 아니라 대부분의 AI 연구 그룹이 진행하고 있다.
최근 오픈 AI는 성명을 통해 수학이 “중요한 연구 분야”라며 새로운 버전의 GPT가 수학적
추론이 필요한 수 천 개의 문제를 64%의 정확도로 풀어냈다고 밝히기도 했다.