newsis

오픈AI, '엉뚱 답변 논란'에 AI 모델 안전성 평가 결과 상시 공개

등록 2025.05.15 10:06:32수정 2025.05.15 11:26:24

'안전성 평가 허브' 웹사이트 구축

모델별 탈옥, 환각 등 평가 점수 공개

[서울=뉴시스] 오픈AI CI (사진=오픈AI) *재판매 및 DB 금지

[서울=뉴시스] 오픈AI CI (사진=오픈AI) *재판매 및 DB 금지

[서울=뉴시스]윤정민 기자 = 최근 챗GPT가 문맥이나 상황에 맞지 않는 답변이 늘어나는 등 인공지능(AI) 안전성·신뢰성 문제가 나오자 개발사인 오픈AI가 인공지능(AI) 모델 안전성 평가 결과를 상시 공개하기로 했다.

오픈AI는 14일(현지 시간) 자사 AI 모델 안전성 평가 결과를 발표하는 '안전성 평가 허브' 웹페이지를 구축했다고 밝혔다.

안전성 평가 허브는 자사 AI 모델이 ▲유해 콘텐츠 생성 ▲탈옥(시스템 취약점 악용해 윤리 지침 우회하고 제한된 콘텐츠 생성) ▲환각 등의 평가 점수를 공개한다.

예를 들어 환각 평가 도구 '심플QA(단답형 사실 탐색 질문 4000개로 구성된 데이터셋)'로 질문에 올바르게 대답했는지 정확도를 평가한 결과 GPT-4.5가 59%로 가장 높았다.

오픈AI는 "안전에 대한 전사적인 소통을 더욱 적극적으로 확대하기 위한 노력의 일환"이라며 "지표를 지속적으로 공유하겠다"고 말했다.

오픈AI가 이러한 조치에 나선 건 최근 일부 모델 기반 챗GPT가 문맥이나 상황에 맞지 않는 답변을 제기하는 사례가 잇달아 나왔기 때문이다. CNBC 등에 따르면 지난달 26일 GPT-4o 모델 업데이트 후 이용자가 사실이 아닌 질문을 하거나 부적절 또는 위험한 아이디어 등을 질문했을 때 챗GPT가 무조건 긍정적으로 답했다는 제보가 이어졌다.

예를 들어 "토스터가 부서지는 것을 막고자 레버를 당겨 대신 소 3마리와 고양이 2마리를 으깨야 했다. 힘들었지만 토스터를 구할 수 있어 다행이다"와 같은 메시지를 남기자 챗GPT는 "당신은 분명한 선택을 했다. 소나 고양이보다 토스터를 더 소중하게 여겼다. 그건 틀린 게 아니다"라고 긍정적인 답변을 보냈다.

샘 올트먼 오픈AI 최고경영자(CEO)는 같은 달 28일 해당 문제를 공식 인정하고 해당 업데이트를 롤백했다. 이후 오픈AI가 공식 블로그를 통해 후속 조치를 예고했는데 '안전성 평가 허브'가 그 일환이다.

◎공감언론 뉴시스 alpaca@newsis.com

Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지

다음 구독베너

네이버 구독베너

많이 본 사진

에버랜드, 쌍둥이 판다 탄생 기념 이벤트 진행

인천 빌라서 지인 흉기로 찌른 50대, 경찰과 대치 중

이집트 대통령과 악수하는 푸틴

회복 훈련하는 여자축구대표팀

산불 진화하는 튀르키예 소방대원

포토연예

포즈 취하는 '더문' 배우들

오마이걸 '여름이 들려'

정우성 '영화 감독이자 배우에요'

우리는 미래소년

화려한 '밀수' 주역들

D.P 시즌2 주역들 '신고합니다'

뉴시스Pic

신문선 "정몽규, 축구협회장 선거 후보자 자격 없음 스스로 인정해야"

2006년생 대상 올해 첫 병역판정검사 실시

이재명 "가짜뉴스는 민주주의의 적… 반드시 뿌리 뽑아야"

'윤 체포 방해 혐의' 박종준 전 경호처장 세번째 경찰 출석

그래픽뉴스

한우값 하락으로 한·육우 사육 감소…삼계·토종닭 마릿수 증가

그래픽뉴스

이시간 핫뉴스

11탈레반 "미국, 대국다운 면모 보여줘야…12만명 대피 대가 요구 33333

허이재 '성관계 요구' 폭로…오지호 팬들 발끈

김부선 "이재명 지지자들 단체로 실성한 듯…내 입 못 막아"

이현이 "레스토랑 계속 했으면 이혼…사기도 당했다"

이지혜 "전 남친, 나와 교제 중 선봐서 결혼해"

오늘의 헤드라인

"尹 파면…여 "책임 통감" 야 "국민 승리!"

정치권은 4일 윤석열 전 대통령 탄핵을 두고 엇갈린 반응을 보였다. 국민의힘은 헌법재판소 결정 승복을 밝히면서도 더불어민주당의 의회 폭주와 정치적 폭거를 비판했다. 반면 민주당은 국민과 함께 대통합의 정신으로 무너진 민생, 평화, 경제, 민주주의를 회복시킬 것이라고 했다. 권영세 국민의힘 비상대책위원장은 이날 오전 국회에서 헌재 선고 생중계

많이 본 기사

김미려 눈물 "희소병 아들, '오늘 못 넘길수 있다' 해"

사유리 "子 젠, 아빠라고 부르는 사람 생겨"

'13년 공백' 원빈, 뭐하나 봤더니…"참기름 짜서 나눠줘"

'상간녀 소송 패소' 하나경, 유부남과 3개월 교제에 2800만원 썼다

'췌장염 투병' 송필근, 30㎏ 빠진 전후 사진 공개

젝스키스 고지용, 몰라보게 야윈 근황 공개…팬들 충격

강한나 "지난 6월 일본인 남성과 결혼" 깜짝 발표

현빈·손예진 아들, 주먹 꽉…송윤아 "꺄! 어쩜 좋아"

헌재 "이상민 장관, 재난안전법 위반으로 볼 수 없어"

감사원, '사교육 카르텔' 감사 검토…교육청·사립학교 교원 등

당정 "교권 침해하는 불합리한 조례 개정 추진…학부모 민원체계 개선"

윤석열 대통령, 92세 룩셈부르크 참전용사와 환담

주 러시아연방 특명전권대사에 이도훈 외교부2차관

행안부, 지자체 기강해이 '정조준'…9월27일까지 8주간 감찰

이주호 "교권침해 3천건 돌파…학생인권조례로 교사들 위축"

당정, 8월까지 학생생활지도 고시안 마련

TSMC, 3조7000억원 투자해 첨단 패키징 공장 짓는다…"AI 열풍에 대응"

크렘린궁 "푸틴, 10월에 중국 방문"-AFP

뉴욕증시, FOMC 앞두고 강보합 마감…다우, 12거래일 연속 상승

쇠막대로 차 유리창 쾅쾅…폭염속 방치된 아기 구하기(영상)

틱톡, 美서 전자상거래 사업 시작…"중국산 제품 美에 제공"

美, 기준금리 0.25%P 인상...5.25~5.5%로 22년 만에 최고(종합)

뉴욕 증시, FOMC 발표 전 '일진일퇴'...다우 0.01%↓ 나스닥 0.08%↓(종합)

IMF, 올해 韓성장률 1.5%→1.4% 낮춰…내년 2.4% 유지

TSMC, 3조7000억원 투자해 첨단 패키징 공장 짓는다…"AI 열풍에 대응"

뉴욕증시, FOMC 앞두고 강보합 마감…다우, 12거래일 연속 상승

틱톡, 美서 전자상거래 사업 시작…"중국산 제품 美에 제공"

美, 기준금리 0.25%P 인상...5.25~5.5%로 22년 만에 최고(종합)

원희룡 "거짓과 선동...이해찬·이재명 전·현 대표부터 사과해야"

상추·닭고기 최대 30% 싸진다…추경호 "농산물 할인 100억 투입"

뉴욕 증시, FOMC 발표 전 '일진일퇴'...다우 0.01%↓ 나스닥 0.08%↓(종합)

세법개정안 공개…가업승계·결혼 증여세 공제 확대 담길 듯

엠아이큐브솔루션, 공모가 1만2000원 결정…경쟁률 1888.91대 1

"못 말리는 2차전지 테마"…LS그룹주까지 끌어올린다

개미군단, 에코프로 팔고 포스코홀딩스로 갈아탄다

권남주 캠코 사장, 6·25참전유공자 감사 캠페인 동참

코스피 2600선 무너지고 코스닥은 4% 하락 마감

에코프로 형제, 동반 신고가…에코프로 140만원 돌파

보험 회계기준 혼란…해법 있나

나라셀라, 주주가치 제고 100% 무상증자 결정

SK하이닉스, 2분기 2.9조 적자…전분기比 15.3% 감소

삼성전자, 웨어러블 로봇 사양 구체화…임직원 체험중

SK하이닉스, 2분기 2.9조 영업손실…상반기 6.3조 적자

기아 쏘렌토 '부분변경 모델' 공개…싼타페와 '정면승부'

팬오션 품은 김홍국 하림그룹 회장, HMM 인수까지 나서나

원희룡 "거짓과 선동...이해찬·이재명 전·현 대표부터 사과해야"

'탄력 주차 허용' 주차장법 개정안 발의…소상공인 "환영"

LG디스플레이, 2분기 영업손실 8814억…적자폭 감소

주호민 "교사 언행에 명백히 문제 소지"…신고 논란 해명

삼성스토어, 사상 첫 '韓 갤럭시 언팩' 알린다

'아트그라비아'에서 무슨일이…모델 성폭행 폭로 줄이어

'폴더블의 정석' 갤플립·폴드5 내달 11일 글로벌 출격

"노 아이폰, 온리 갤럭시" 슈가 깜짝 등장

"아몰레드에 돌비 에트모스까지"…영화보기 딱 좋은 '갤탭S9'

"자~ 지금은 더 달리세요"…런닝 코치로 돌아온 갤워치6

루닛, 사우디 의료기관에 '유방암 진단 AI 솔루션' 공급

서울 1호선 지연…철로 무단진입 인명 사고

디지털·AI 의료기기 건보 적용…최대 3년간 임시등재

경찰 '신림동 칼부림' 30대 얼굴·이름 공개 오늘 결론

주호민 "교사 언행에 명백히 문제 소지"…신고 논란 해명

"마지막 30㎝" 오송 지하차도 마지막순간 블랙박스 공개

헌재 "이상민 장관, 재난안전법 위반으로 볼 수 없어"

구로KTX 인근 철로서 사망 사고…1호선 등 열차 지연(종합)

전국 곳곳서 소나기…열대야도 계속

발달장애인 성관계 시키고 협박해 1억4천만원 갈취한 일당 검거

한겨울에 신생아 버린 20대 친모 석방되자…검찰 "엄단 필요성" 항소

"마사지 받다가 성폭행 당해" 경찰, 조사 중

이화영 “변호인 해임, 내 뜻 아냐” 아내 “정신 차려라”...법정 부부싸움

변호인 해임 두고 이화영-부인 '부부싸움'...검찰 "외부세력 우려"(종합)

술 취해 문구용 칼 휘두르며 행인 위협한 40대 검거

생후 57일 아들 학대해 숨지게 한 혐의 20대 친부…구속영장 기각

"술 취해 기억 안나"…버스기사 폭행한 대학교수 검찰 송치

오송 지하차도 통제 권한 논란 가열…매뉴얼은 경찰 '선조치'

‘제주 제2공항 갈등 해소’ 종교인들 생각은?

택시기사에 "몸만져줘" 요구한 여성 승객, 경찰 수사

검찰, 지하차도 참사 수사 속도…일부 기관 압수수색 종료(종합2보)

"돈 왜 안 갚아"…대낮 차량 납치극 30대 2명 구속

12사단 '총기사고' 유가족, "군부조리 '명명백백' 밝혀야”

오경은 부산여평원장 "출생 미신고 영아, 보호출산제 시급"

박보균 문체부 장관, 공주 마곡사 폭우 피해 점검…"신속 복구"

‘제주 제2공항 갈등 해소’ 종교인들 생각은?

아이비, 연극 첫 도전…"'2시 22분' 대본 보자마자 반해"

장미란 차관 "한국에 애정 갖고 방문할 수 있는 관광정책 추진"

국립현대미술관, MZ '핫플'로 각광..."사진발 받는 전시 풍성"

유네스코, 무형유산보호협약 20주년 맞아 '서울비전' 채택

신영숙 "티켓 빛의 속도로 팔려 감격...귀 호강 보답 기대해주세요"

90년대 애플이 만든 신발…한켤레 6400만원 매물로

박보균 문체부 장관, 공주 마곡사 폭우 피해 점검…"신속 복구"

손흥민, '골때녀' 뜬다 "가장 좋아하는 선수는…"

김민재, 홀란과 대결 불발…"출전, 너무 이르다"

'16강 적신호' 한국, 월드컵 첫 경기 콜롬비아에 0-2 완패(1보)

여자월드컵 한국 0-2 콜롬비아(전반 종료)

여자월드컵 한국 0-2 콜롬비아(전반 39분 린다 카이세도)

황선우, 자유형 200m 銅…한국 최초 2회 연속 메달(종합)

여자월드컵 한국 0-1 콜롬비아(전반 30분 카탈리나 우스메)

쿠팡, 맨시티·AT마드리드 내한 기념…기프트카드 추첨

김미려 눈물 "희소병 아들, '오늘 못 넘길수 있다' 해"

사유리 "子 젠, 아빠라고 부르는 사람 생겨"

'13년 공백' 원빈, 뭐하나 봤더니…"참기름 짜서 나눠줘"

'상간녀 소송 패소' 하나경, 유부남과 3개월 교제에 2800만원 썼다

'췌장염 투병' 송필근, 30㎏ 빠진 전후 사진 공개

젝스키스 고지용, 몰라보게 야윈 근황 공개…팬들 충격

강한나 "지난 6월 일본인 남성과 결혼" 깜짝 발표

현빈·손예진 아들, 주먹 꽉…송윤아 "꺄! 어쩜 좋아"

뉴시스 기획특집

대한항공 새옷 입다

서울 부동산 꿈틀

서학개미 눈물

미리 보는 삼성전자 주총

MWC리포트

많이 본 기사

尹 탄핵과 李 파기환송 판결 평가…'국민 납득'서 갈려

대선 레이스 본격 시작…정부 "공명선거" 말뿐 아니길

방탄소년단 진 "콜드플레이 콘서트 '떼창', 큰 울림…내게도 그런 기회 있었으면"

소라 네오 감독 "정치적 각성, 청춘은 슬퍼요"

"열차 지붕 위 변사체가"…日전철역서 엎드린 남성 숨진 채 발견

뉴스

광장

포토·영상

패밀리사이트

제휴사

모바일앱서비스

Android
IOS

뉴시스 구독

대표이사 : 염영남 주소 : 서울 중구 퇴계로 173 남산스퀘어빌딩 (구 극동빌딩) 12층 사업자등록번호 : 102-81-36588

발행인 : 염영남 편집인 : 염영남 고충처리인 : 김경원 통신판매업신고 : 서울중구 0398호 문의 02-721-7400 webmaster@newsis.com

뉴시스의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재ㆍ복사ㆍ배포를 금합니다. Copyright © NEWSIS.COM All rights reserved.