아이티랩 - "로앤컴퍼니 법률 AI, GPT-4보다 변호사 시험 정답률 높아"

[지디넷코리아]

로앤컴퍼니가 만든 법률 인공지능(AI) 시스템 '빅케이스GPT'가 제12회 대한민국 변호사시험 객관식 문제에서 53.3% 정답률을 달성한 것으로 나타났다.

로앤컴퍼니는 18일 빅케이스GPT 성과를 발표하며 내년 상반기 중 변호사 업무 보조 용도 AI 법률 비서를 출시할 계획을 밝혔다.

빅케이스GPT는 AI 기반 통합 법률정보 서비스 빅케이스와 법률 종합 포털 로톡 운영사 로앤컴퍼니가 만든 자체 AI 시스템이다. 앞선 3월 로앤컴퍼니는 오픈AI 최신형 언어 모델인 GPT-3.5와 GPT-4를 활용해 변호사시험 객관식 문항을 풀도록 하는 자체 실험을 실시했고 각각 28.7%와 34%의 정답률이 나오는 것을 확인했다.

변호사시험 객관식 문항은 공법 40문항, 민사법 70문항, 형사법 40문항 등 총 150문항으로 구성된다. 빅케이스GPT는 이 문항들 중 각 19개, 40개, 21개 등 총 80개의 정답을 맞춰 정답률 53.3%를 달성했다.

'빅케이스GPT' 변호사시험 정답률 GPT-4 대비 56

로앤컴퍼니는 빅케이스GPT에 GPT-4를 기반으로 증강검색생성기법(RAG, Retrieval-Augmented Generation) 모델과 자체 고안한 프롬프트 엔지니어링을 적용했다. 또한 빅케이스가 확보하고 있는 국내 최다 판례 329만 건 중 정보 가치가 높은 판례들을 중심으로 벡터화된 데이터베이스를 구축해 법률 분야 질의에 최적화된 답변을 내놓도록 설계했다.

로앤컴퍼니는 빅케이스GPT에 판례뿐 아니라 빅케이스가 보유한 법령 14만 5천 건, 결정례 7천 건, 유권해석 7천 건 등 총 16만 건의 법률정보도 추가로 학습시켰다. 특히 빅케이스GPT는 생성형 AI의 최대 한계점으로 꼽히고 있는 할루시네이션(환각, 정보 왜곡 현상)을 ‘제로’에 가깝게 통제해 데이터의 신뢰성을 대폭 강화한 것이 특징이다. 실제 로앤컴퍼니는 반복적인 테스트를 통해 빅케이스GPT가 가짜 판례나 법령을 제시하지 않는 수준에 이른 것에 대한 검증을 마쳤으며, 향후 지속적인 품질 개선을 거쳐 이를 완벽하게 제거할 예정이다.

로앤컴퍼니는 향후 빅케이스GPT에 다수 언어 모델을 실험·적용하고 자체적으로 개발한 최적 언어 모델을 추가로 적용해 해당 시스템을 고도화할 계획이다. 이를 통해 내년 상반기 중 '슈퍼로이어(Super Lawyer, 가칭)'라는 AI 기반 변호사향 기업간거래(B2B) 서비스형소프트웨어(SaaS) 서비스를 신규 출시할 복안이다. 지난 6월 톰슨로이터에 6억5천만 달러(약 8천450억원)에 인수된 케이스텍스트 '코카운슬' 서비스와 유사하게 ▲법률 메모 생성 ▲법률서면 요약 ▲법률 질의응답 등 기능을 제공해 변호사의 업무 효율 제고에 기여하는 것이 목표다.

김본환 로앤컴퍼니 대표는 "한국어와 대한민국 법률에 최적화된 언어 모델로 개발될 슈퍼로이어는 변호사를 돕는 AI 법률 비서와 같이 구동되며 변호사의 업무효율을 극대화하는 역할을 맡게될 것"이라며 "법률AI연구소를 중심으로 변호사님들의 성과를 높이기 위한 서비스 출시에 집중해 더 많은 변호사의 업무환경 개선에 도움을 드리고 싶다"고 말했다.

의견 0 신규등록      목록