커뮤니티 게시판 : 아주 기본적인 네티켓만 지킨다면 자유롭게 쓸 수 있는 커뮤니티 게시판입니다. 포럼에서 다루는 주제는 각각의 포럼 게시판을 우선 이용해 주시고, 민감한 소재는 비공개 게시판이나 수상한 게시판에, 홍보는 홍보/외부 사용기 게시판에 써 주세요. 질문은 포럼 게시판의 질문/토론 카테고리를 사용해 주세요.

잡담

2022.12.03 01:29

AI 학습, 튜링 테스트에 대한 잡설

Normie https://gigglehd.com/gg/13358903

조회 수 797 댓글 13

이번에 나온 Chat GPT 라는 인공지능... 저는 사용자 초과인지 가입도 안 되고 입뺀 당했군요...

굉장히 생각은 많고 할 말도 많은데 조리있게 쓸 능력이 안 되어서, 어질러놓듯이 씁니다.

- 몇 달 전까지도 AI의 언어 능력에 대해서 매우 낮게 평가하고 있었습니다.

인터넷에서 남이 말해놓은 문장을, 아주 많이 모아서, 그럴싸하게 붙여놓은 것에 언어 능력이 있다고 말할 수 있는가? 이거야말로 '중국집 테스트'의 실제 구현 버전이 아닌가? 그런 생각이었습니다.

- 과거(8, 90년도?)에는 인공지능에 아주 많은 사실(Fact)과 개념(Concept)을 주입한다면 그 지식들을 바탕으로 인공지능이 스스로 사고할 수 있다고 여겼다고 합니다. 그렇지만 이러한 지식을 수십만 개를 주입해도 기초적인 상식을 추론하는 것조차 실패했다고 하더군요. 이 기초적인 상식을 갖는 것은 현재의 거대한 첨단 인공지능에게도 버거운 문제입니다. 들은 간단한 예시를 인용하겠습니다.

버터 조각들을 긴 쇠젓가락에 끼우고, 한 쪽에서 불을 켜면 어떻게 되는가?

(Chat GPT 이용 가능하신 분들은 이런걸 해보시는건 어떨까 궁금합니다)

어린아이도 알 수 있는 문제지만 인공지능이 '불에 가까운 쪽부터 녹아 떨어진다' 라는 답에 도달하려면, 다음과 같은 사실을 적절히 이용하여 추론 과정을 거쳐야 합니다.

버터: 온도가 올라가면 녹는다 (고소하다, 노랗다... 등등의 속성은 필요없음)

녹는다: 물체가 액체가 되는 현상

액체: 담아놓지 않으면 흘러버리게 된다

쇠젓가락: 금속으로 되어있음 (금속: 열을 잘 전달하는 성질을 가짐)

불: 뜨겁다, 가까이 있는 물건의 온도를 높인다

열은 뜨거운 것 근처에 있거나 닿아 있으면 가까운 쪽부터 먼 쪽으로 전달된다

=> '불'에 닿아있는 '쇠젓가락'이 '불'에 가까운 쪽부터 '온도'가 상승한다. 이에 '쇠젓가락'에 닿아있는 '버터'도 '온도'가 상승하여 '녹는다'. 녹은 '버터'는 '액체'가 되어 떨어지게 된다.

이 정도의 수준이라면 정말로 지능이 있다고 부를 만 하겠네요.

- AI가 진정으로 사고한다고 주장하려면, 인터넷 안에 답이 존재하는 지식을 묻는 것이 아니라, 추론 능력을 시험하는 것에 포커스를 두어야 한다고 생각합니다. 이전의 언어 AI의 결과물은, 마치 제가 교양과목 과제로 <몽골 제국이 번영한 이유를 서술하시요> 라는 레포트를 쓰는 것과 유사하다고 생각합니다.

저는 이과라서 세계사를 잘 배우지도 않았고, 대학에 와서도 몽골에 대해서는 거의 들어본 적도 없습니다. 그렇지만 인터넷을 켜 보죠. 여기 지식의 보고 나무가 있네요. 찾아보니 다른 블로그도 나옵니다. 이 글들이 대충 비슷비슷한 말을 하는 것 같네요. 글들을 모아서 비슷한 주제별로 나누고, 글들마다 말하는게 다른 내용은 뺍시다. 너무 어려운 단어나 특정 사건도 빼는 것이 좋겠네요. 글의 호응이 맞지 않는 부분과 맞춤법이 틀린 것도 고칩시다. 11시 59분에 제출.

이 보고서는 몇 점일까요? 일단은 (아주 헛소리를 보고 가져온 것이 아니라면) 거기에는 대략적으로 맞는 내용이 써져 있을 것이고, 저는 몽골에 대해서는 전혀 모르지만 글들을 보고 비슷한 성격의 문단끼리 정리하는 능력은 있으니 대충 몽골 제국의 성립, 발전, 전쟁, 제도, 쇠퇴, 영향과 의의... 이렇게 정리를 하고 맞춤법 검사도 빡세게 돌렸으니 문장도 크게 흠잡을 곳은 없을 것입니다. 그리고 개개의 항목에서의 사실 여부도 좀 맞긴 할 것입니다. 보통 사람들이 보기에는 썩 나쁘지 않겠죠.

그러면 교수님이 읽으면 어떨까요? 저의 글에는 역사적 맥락에 대한 이해가 전혀 없으므로 흠잡을 구석이 많을 것입니다. 저는 사건들의 순서와 인과를 구별할 역사적 지식이 없기 때문에 오비이락 식 해석이나 인과를 뒤집는 오류 또한 있겠습니다. 학자들 사이에서는 터무니없지만 일반인들은 믿고 있는 오류도 많겠군요. 이런. 사실 한 대상이었는데 몽골식 표기와 한자식 표기로 되어 있는 명칭을 서로 다른 두 대상인줄 알고 썼습니다. 교수님은 이제 의심을 하겠죠. 알고 쓰는 글이 아니라는 것을.

현재 인공지능의 결과물은 이 레포트와 같다고 생각합니다. 지식의 탐색, 분류, 나열이라는 기능에서는 (때로는 밤샘 대학생보다 앞서는) 좋은 결과를 내지만, 이 인공지능은 몽골의 역사에 대해서는 전혀 아는 것이 없습니다. 따라서 많은 실수를 내게 됩니다. 이건 제가 아무리 글쓰기 책을 사 읽고 구글링을 잘 하는 법을 연습한들(언어 모델의 정교화 거대화), 몽골 역사 공부를 제대로 하지 않으면(실재적 지식과 통찰) 반복하게 되는 실수겠죠.

이것이 '중국집 기능'과 '실제 지식'의 차이점이라 생각합니다.

- 그런데 사람도 정말 체계적이고 심오하게 학습을 할까요? 제가 워낙 많은 것들을 대충대충 배우고, 대충 읽고, 스택 오버플로우에서 읍읍... 해서 그런지, 사람의 학습도 엄청 얼레벌레 따라하는 단계에서 조금씩 고쳐가는 것 같습니다.

일단 잘 모르는 채로 믿을 만한 사람들이 하는 말들을 따라하고 (맹목적으로 신뢰하고) 시간이 지남에 따라 서로 모순이 있다는 것을 깨닫고, 무엇이 맞는지 다른 사람들에게 물어보다, 이제는 내 생각이 좀 생긴 것 같습니다. 내 생각을 포럼에 올립니다. 반박이 들어오네요. 나름 지금까지 본 내용들을 가지고 반박을 씁니다. 더 반박이 들어옵니다. 잘 모르겠습니다. 그 내용에 대해 가장 자세한 자료를 찾아 기술 문서나 책을 꺼냅니다. 거기서 얻은 지식으로 보강한 뒤에 다시 글을 씁니다. (계속된 반복)

인공지능이 레딧 따위가 아니라 스스로 논문이나 도서를 찾아 팩트체크를 하기 시작한다면, 그 내부가 중국집이건 일식집이건, 대단히 무섭고 놀라운 기계가 될 것 같습니다.

+ 구글의 어느 엔지니어가, 자기 모델에 인격이 있다는 횡설수설을 하다가 해고당한 적이 있었는데,

지성과 인격은 아주 달라서 분리를 해야 할 것 같습니다. 드물지만 몽유병 상태에서 운전을 하는 등의 일상 행동을 하는 경우가 있는데, 이 사람은 지금 뭔가 지적인 태스크를 하고 있지만 인격은 전혀 없다고 보아야 할 것 같습니다. 어떤 거대한 '몽유병 천재 기계' 가 있다면, 아주 고도의 지성은 갖고 있지만 인격이나 감정은 티끌만큼도 존재하지 않는... 그런 것이 가능하다고 저는 믿습니다.

구글이나 다른 거대 테크 기업의 인공지능 또한 비선형 모델이 아주 많을 뿐인데 여기에 감정이 끼어들 공간이 없을 것 같네요. 사람의 뇌에서 감정을 지배하는 구역이 따로 있는 것처럼, 인격이 있는 인공지능을 위해서는 감정 아키텍처를 따로 개발해서 붙이던가 해야 할 것 같습니다.

아 너무 졸립니다. 일단은 여기까지 두서없이 써 보았습니다...

삭제 요청

목록 스크랩

위로 아래로 댓글로 가기

Comments '13'

?
포인트 팡팡! 2022.12.03 01:29

Normie님 축하합니다.
팡팡!에 당첨되어 50포인트를 보너스로 받으셨습니다.

수정 삭제
설아 ShellCat ː 雪雅 - 1st shell 2022.12.03 01:32

저도 그래서 현 AI라 부르는 것들 대부분은 그냥 빅데이터용 초고속 검색기라 생각합니다
?
photino65 2022.12.03 01:35

What happens when you put pieces of butter in long iron chopsticks and put fire on one side? (영작 실력이 썩 좋지 않아서 영어가 이게 맞는지는 모르겠습니다)

I'm not sure what you mean by putting pieces of butter in long iron chopsticks and putting fire on one side. If you put butter on a chopstick and hold it over a fire, the butter will melt and may drip or catch fire. However, I would not recommend doing this as it could be dangerous and potentially cause burns or a fire. It is also not a safe or effective way to cook or melt butter. Instead, you can simply place the butter in a pan or pot over a stove top flame to melt it.

뭔 소리 하는지 모르겠지만 버터가 녹는다고 답변하고 그런 짓은 위험하다고까지 얘기해 줍니다.
Normie 2022.12.03 01:38

오... 감사합니다.. 읽어보니까 AI가 무언가 열심히 추론하려고 한 것은 같은데, 그냥 butter와 fire 라는 키워드만 가지고 인터넷에서 연관되는 컨셉들을 (요리, 쿠킹 팬..) 나열한 것이 아닌가 의심도 듭니다.
?
photino65 2022.12.03 02:09

ChatGPT는 이런 상식 류의 질문에 훨씬 더 잘 답한다고 하네요 https://twitter.com/goodside/status/1598053568422248448
Normie 2022.12.03 14:45

흥미롭군요.. 개발진들은 일부러 이런 케이스를 계속 테스트하면서 내성을 만든 걸까요? 다른 것들로 도전을 해보고 싶게 됩니다
?
Neons 2022.12.03 02:43

저도 입뺀이라 손가락만 빨면서 구경하고 있습니다만, 트위터에 올라오는 몇몇 예시로 추측건데 프로그래밍에 있어서는 초보 이상의 추론을 하고 있습니다.

이를테면 코드를 입력받아서 버그를 분석해 주는데 - https://twitter.com/search?q=chatgpt%20ctf&src=typed_query, 코드가 어떻게 동작할 지 판단할 수 없으면 할 수 없는 작업이죠.

그리고 주어진 문장을 받아 그것을 구현하는 코드를 작성할 수 있는데 - https://twitter.com/search?q=chatgpt%20code%20generation&src=typed_query&f=top, 이 또한 문장을 그냥 stack overflow에 검색해서 만들었다고 보기엔 지원하는 언어도 광범위하고, 그냥 요구사항을 이해하고, 자기가 작성하는 코딩 언어를 이해하고 있다고밖에 할 수 없습니다.
Normie 2022.12.03 15:01

Copilot과 같은 프로그램 합성 분야는 큰 투자가 되고 있고 그 수준도 계속 발전하는 것으로 알고 있습니다. 저는 컴퓨터 전공이 아니라 잘은 알고있지 못하지만, 프로그램 합성론 전공하는 친구 말로는, 학부 4학년 정도는 이길 수 있다 라고 장담을 하더군요. 이런 코드는 no brain copy가 아니라 어떤 프로그램을 만들어야 하는지 잘 이해하고 쓰는 것 같습니다.
캐츄미 5700g, 5800x, 5950x 2022.12.03 10:15

전 사실 사람의 지능도 생각보다 별거없다는 쪽이라
그냥 지능형 검색을 누가하냐의 차이겠죠
?
고슴도치 2022.12.03 10:58

GPT-3 는 추론을 위해서 GPU VRAM 400GB 정도를 요구합니다. 주어진 텍스트 문장을 400GB 정도의 파라미터를 지나서 그 다음에 올 단어를 하나를 내놓는건데 딱 이정도의 논리적 사고가 발생하는것 같습니다.

인간과 차이점은, 인간은 자신의 생각한것을 기반으로 다시 생각을 수행해 만족할만한 결론이 나오면 말을 하지만, 이거는 한번 생각한걸 결론이 어떻던간에 그대로 내놓는겁니다.

그래서 직접 해보시면 아시겠지만 VRAM 20GB, 40GB, 80GB, 400GB, 510GB 짜리 모델 각각이 내놓는 답변의 심도가 다릅니다.

이러한 방식의 한계점은 더 깊은 추론이 요구되면 모델 크기를 더 키워야할텐데 이는 별로 지속가능하지 않다는점, 앞으로의 Future Challenges 는 더 작은 크기의 모델을 사용해 자신의 답변으로부터 피드백을 받아 Iterative 하게 답변을 개선해나가는, 인간과 비슷한 사고과정을 수행해 나가는 구조로 변화가 필요하지 않을까 하네요.
Normie 2022.12.03 15:16

인공지능 내부에서 iteration을 거쳐서 퇴고한 답을 내놓을 거라고 반 당연하게 생각하고 있었는데 실은 그렇지가 않군요.. 테크 대기업의 거대 인공지능들은 한번 학습에 비용이 수십억씩 들어간다고 하던데 계속 모델과 하드웨어를 키우는 방식은 한계에 도달해가고 있는 것 같습니다.
근데 이런 VGA들이 12GB 정도의 VRAM을 가짐을 고려해보면, 그래픽카드 40장도 안 되면 생각보다 작네요..?
책읽는달팽 악은 사람을 사람취급 안하는데서 시작된단다 - Terry Pratchett 2022.12.03 11:30

대한민국에 HB Press 에서 튜링의 논문집 몇편을 번역해놓은게 있습니다. 튜링테스트(이미테이션 게임)과 튜링 머신등에 대한 논문을 번역해 놨더라고요 - https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=198322526 제목이 능지에 관하여... 인데, 짧은데 어려운 그런 책이군요
Normie 2022.12.03 15:18

굉장히 흥미로운... 그런 고전이군요.. 예전에 훈련소 있을때 인공생명 (http://www.yes24.com/Product/Goods/90875070) 읽다가 너무 어려워서 때려친 적이 있는데 이건 읽을 수 있을지 모르겠습니다 도서관을 찾아봐야겠네요

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

List of Articles
번호	분류	제목	글쓴이	날짜	조회 수
55531	잡담	방금 본 특이한 우유 먹는 법 11	유니	2024.04.18	669
55530	잡담	Lanczos 님 미패드 4 나눔인증 /ㅅ/ 1	도개주	2024.04.18	286
55529	잡담	덮어놓고 사다보면 1	카토메구미	2024.04.18	363
55528	잡담	꾸준히 올라오는 구인 광고가 있더라고요 9	낄낄	2024.04.18	662
55527	잡담	새폰이 왔습니다 4	홍콩오리	2024.04.18	405
55526	잡담	쿠쿠다스님의 e5-2680v2 보드셋 수령! 2	yyang	2024.04.18	214
55525	잡담	작혼) 크아아아악 요스타~~ 1	카토메구미	2024.04.18	284
55524	잡담	작혼) 이번 콜라보도 전부 뽑긴 글렀습니다 7	유에	2024.04.18	253
55523	잡담	진짜 오래간만에 케갈 마렵네요 2	조마루감자탕	2024.04.18	303
55522	잡담	테무는 어떻게 돈을 버나? 10	허태재정	2024.04.18	941
55521	잡담	새 맥북이 마려운 이 순간.. 8	ExpBox	2024.04.18	686
55520	잡담	평택항이 진짜 터저나가는건지.. 1	급식단	2024.04.18	825
55519	잡담	요즘 아마존 직구가 영 밸로인게 2	고자되기	2024.04.18	717
55518	잡담	메모리 사용률.... 13	뚜찌`zXie	2024.04.17	709
55517	잡담	지진이 왔습니다. 8	문워커	2024.04.17	548
55516	잡담	잡담 세가지	AKG-3	2024.04.17	217
55515	잡담	아마존에서 49달러 이상 주문 시 한국으로 무료 ... 9	낄낄	2024.04.17	714
55514	잡담	박대리 모셔왔습니다. 4	툴라	2024.04.17	393
55513	잡담	이왕이면...병에 걸려서...	뚜찌`zXie	2024.04.17	361
55512	잡담	알리발 안드로이드 오토 단말기 지름 썰 4	스프라이트	2024.04.17	540

2016년 7월 이전글 링크: 커뮤니티 게시판 / 공지사항 게시판

로그인

AI 학습, 튜링 테스트에 대한 잡설

나눔글꼴 설치 안내

이 PC에는 나눔글꼴이 설치되어 있지 않습니다.