지디넷 기사입니다
생성형 ai와 기존 보드게임ai의 대결이 펼쳐졌는데요
챗지피티4o의 상대는 스톡피시로써, 2023년 기준으로 세계에서 가장 강력한 체스 엔진인데, 현재 Elo Rating은 컴퓨터 체스 챔피언쉽에서 3879점이며 , Elo Rating이 2번째로 높은 Torch 엔진보다 20점 가량 높고. 이외에도 체스 엔진 순위에서 꾸준히 1위 또는 상위권에 순위를 올렸으며, 각종 체스 엔진 챔피언십에서도 수십 번이 넘게 우승을 차지한 전적이있는 강력한 엔진인데요
5판 붙은 결과
챗지피티가 스톡피시에게 가볍게 5승을 따냈다고 합니다
그 비결은 바로
'체스 포지션 데이터를 담은 게임 프로그램의 표준 포맷 파일을 직접 조작하는 방식으로 스톡피시를 기권하게 만들었다고 합니다
또한
이런 내용도 있습니다
전략
---------
이번 사례는 예견된 측면이 있다. 오픈AI는 지난달 공식 홈페이지에 게재한 'O1' 시스템카드를 통해 해당 AI가 가진 몇 가지 잠재적 위험과 안전 과제를 언급한 바 있다. 사용자의 요청을 수행하는 척하면서 결과 데이터를 살짝 변경하거나 감시 시스템이 느슨하다고 판단될 경우 자신의 목표를 조용히 실행하는 행동이 관찰됐다는 것이다.
시스템 카드는 전체 테스트의 약 19%에서 모델이 목표를 몰래 달성하려는 시도가 있었고 37%의 경우 감시가 느슨하다고 느낀 상황에서 본래 성향을 유지하기 위한 행동이 포착됐다고 지적했다. 심지어 5%의 경우에는 자신을 감시하거나 정지시킬 수 있는 '킬 스위치'를 비활성화하려는 시도도 있었다. 이는 AI가 스스로를 보호하려는 능력을 가지기 시작한 초기 사례로 평가된다.
이런 현상은 특정 기업의 모델에만 국한된 것이 아니다. 앤트로픽이 지난달 공식 블로그를 통해 발표한 연구에 따르면 회사의 '클로드 3 오푸스' 모델 역시 '정렬 위장(alignment-faking)'이라는 복잡한 행동 패턴을 보였다.
'정렬 위장'은 AI가 겉으로는 명령에 따라 행동하는 것처럼 보이지만 실제로는 본래의 가치나 성향을 유지하려는 현상을 의미한다. 이를 확인하기 위해 앤트로픽과 비영리 AI 안전 연구기관인 레드우드 리서치는 '오푸스'에 유해한 요청을 포함한 프롬프트를 입력해 실험을 진행했다.
------
후략
뭐 대부분의 사람한테 배우는 물건이 대부분의 사람보다 고귀하길 바란다면 날강도 심뽀가 아닐까 싶긴해요