인터넷 / 소프트웨어 : 윈도우즈, 리눅스, 기타 운영체제, 각종 어플리케이션, 프로그램, 소프트웨어, 인터넷, 인터넷 서비스에 대한 이야기, 소식, 테스트, 정보를 올리는 게시판입니다.

소식

2023.12.24 17:33

AI 모델 훈련용 이미지 데이터 세트에 아동 성 학대 자료가 포함

조회 수 492 댓글 0

Extra Form
참고/링크	https://www.404media.co/laion-datasets-r...ild-abuse/

스탠포드 인터넷 연구소는 AI 이미지 생성 모델 훈련에 사용하는 대형 데이터 세트 LAION-5B에 아동 성 학대 자료로 의심되는 이미지 3226점이 포함됐다고 밝혔습니다.

LAION은 안정하지 않은 컨텐츠가 없는지 확인될 때까지 데이터 센트를 공개 액세스에서 제외 처리했습니다.

이 데이터 세트는 58억 개가 넘는 온라인 이미지의 주소와 캡션으로 구성됩니다. 인터넷에서 다양한 이미지를 크롤링해서 만들었습니다.

스탠포드의 연구팀은 LAION의 NSFW 분류기를 써서 데이터 세트를 필터링하고, 컨텐츠 조정에 사용하는 툴인 포토DNA를 돌렸습니다. 아동 성 학대 자료를 사람이 직접 보는 건 연구 목적이라고 해도 불법이기에, 각 이미지마다 디지털 서명을 만들고 이를 테스트 이미지와 일치하는지 확인하는 지각 해싱을 써서 찾아냈습니다.

이런게 섞이는 것도 문제고 찾는 것도 여간 복잡한 일이군요.

삭제 요청

TAG •

ai,
이미지,

목록 스크랩

위로 아래로 댓글로 가기

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

모질라: 파이어폭스가 기울어진 운동장을 겪고 있다

모질라는 파이어폭스가 퍼스트파티 웹브라우저보다 플랫폼적으로 불리한 상황에 처해 있다고 주장합니다. 기본 브라우저 설정을 제한하거나, 일부 기능을 써드파티 브라우저에서 막거나, 써드파티 브라우저에 특정 엔진을 강요하고 있어, ...

Date2024.01.24 소식 By낄낄 Reply20 Views1111

Read More
Stability AI의 소규모 언어 모델, Stable LM 2 1.6 B

Stability AI가 소규모 언어 모델인 Stable LM 2 1.6 B을 발표했습니다. 영어/스페인어/독일어/이탈리아어/프랑스어/포르투갈어/네덜란드어로 학습된 언어 모델로, 16억 SLM의 피라미터를 사용해 학습했습니다. 대규모 언어 모델은 덩치가...

Date2024.01.24 소식 By낄낄 Reply0 Views415

Read More
윈도우 11을 100MB까지 압축, 텍스트만 사용 가능

윈도우 11의 용량을 100MB까지 줄이는데 성공했습니다. 설치 파일의 크기는 100MB밖에 안되지만, 이를 위해 그래픽 인터페이스는 다 쳐내고 텍스트 전용 모드만 남겼습니다. 설치된 후에는 1.91GB를 차지하며 4개의 폴더가 있습니다. 100...

Date2024.01.22 소식 By낄낄 Reply17 Views2374

Read More
No Image

NTP를 발명한 분이 유명을 달리하셨습니다.

데이비드 L. 밀스( David L. Mills) 박사님께서 약 3일전즈음에 유명을 달리하셨습니다. 1985년 COMSAT 회사에서 근무하는 동안 ARPANET에 연결된 컴퓨터의 시간을 맞춰야 할 필요성이 생겨서 처음 Network Time Protocol 을 개발하시게...

Date2024.01.21 소식 By책읽는달팽 Reply5 Views1199

Read More
우수관로 개선사업중 SKBB 광케이블 끊겨 천안아산 일대 서비스 중지

천안시에서는 우수관로 개선사업중 아스콘 절단작업 했으나 그과정에서 단 2cm로 뭍인 광케이블 20가닥이 절단이 되어 천안전지역 및 아산시 일부 까지 skbb 인터넷서비스 및 iptv 가 중지되었습니다. 처음엔 자른놈이 문제인줄 ...

Date2024.01.21 소식 By툴라 Reply22 Views3085

Read More
No Image

애플, 유럽에서 써드파티에게 NFC 결제 기술 공개를 제안

애플이 유럽 지역에서 써드파티 개발자가 NFC 비접촉 결제를 아이폰에서 쓸 수 있도록 허용할 것이라고 말했습니다. 현재 애플 아이폰은 애플 페이나 애플 월렛 같은 앱만 비접촉 결제를 할 수 있습니다. 역시 유럽이 풀면 무조건 열리는...

Date2024.01.21 소식 By낄낄 Reply4 Views860

Read More
화웨이, 하모니OS 넥스트 커널이 리눅스보다 3배 효율적이라고 주장

화웨이는 자체 개발 운영체제인 하모니OS 넥스트의 메모리 관리 효율이 리눅스보다 3배 더 좋다고 주장했습니다. 또 무엇보다도 보안을 최우선으로 여기며 최고 수준의 보안 인증을 획득했고, AI 기능도 제공합니다. 그래봤자 중국 아니면...

Date2024.01.21 소식 By낄낄 Reply4 Views1172

Read More
윈도우 11 24H2, AI 기능을 대거 보강

마이크로소프트는 코드네임 허드슨 밸리를 준비하고 있습니다. 윈도우 11의 24H2 업데이트로 출시될 예정입니다. 윈도우 12로 나온다는 설이 있었는데 그냥 11이라네요. 9월 출시를 예상하고 있습니다. AI와 머신 러닝을 활용해 사용자 경...

Date2024.01.20 소식 By낄낄 Reply5 Views1242

Read More
No Image

아마존, 알렉사의 유료 구독 서비스인 알렉사 플러스를 준비 중

아마존이 알렉사 플러스라는 유료 구독 모델을 준비하고 있습니다. 6월 30일을 마감일로 잡고 15,000명이 테스트했다네요. 좀 더 대화형이고 개인화된 AI 기술을 제공할 계획이나 아직은 품질이 썩 높진 않다고 합니다. 그리고 알렉사에 ...

Date2024.01.20 소식 By낄낄 Reply0 Views300

Read More
No Image

윈도우 AI 시스템에서 16GB 메모리가 필요

마이크로소프트는 윈도우 11 23H2에서 다양한 AI 가속 기능을 추가합니다. 여기에는 코파일럿 등이 포함되지요. 이를 실행하기 위해서는 NPU가 탑재된 CPU 외에도 16GB 메모리가 필요하다고 하네요. 그래서 메모리 수요가 늘어날 것으로 ...

Date2024.01.19 소식 By낄낄 Reply7 Views1353

Read More
No Image

CPU-Z 2.09 버전 발표, 새 CPU 지원, 내장 벤치마크 변경

CPU-Z 2.09 버전이 나왔습니다. 인텔 메테오레이크 지원 향상, 애로우레이크 예비 지원 향상, AMD 호크 포인트/호크 포인트 2 지원, 지포스 RTX 4070 슈퍼 지원. 내장 벤치마크는 모든 코어/P코어만 상대로 실행하도록 선택 가능합니다.

Date2024.01.19 소식 By낄낄 Reply2 Views529

Read More
No Image

간단한 수정으로 리눅스 파일 시스템 성능이 6% 향상

리눅스 커널 I/O 전문가인 Jens Axboe가 몇 년 동안 미뤘던 코드를 적용시켰습니다. 5분만에 끝난 이 작업으로 I/O 작업의 성능이 6% 올랐다고 하네요. 구체적으로는 I/O 시스템의 쿼리 시간을 줄여서 성능을 높였습니다. 이 패치는 리눅...

Date2024.01.18 소식 By낄낄 Reply4 Views1330

Read More
No Image

애플 앱 스토어 관련 소식, 미국에서 앱스토어 대신 다른 곳에서 결제 가능

미국에서 애플 앱스토어 대신 다른 곳에서 상품을 구매할 수 있습니다. 개발자가 준비한 구매 웹페이지로 이동하도록 링크를 넣을 수 있으나, 이렇게 해도 애플이 12~27%의 수수료를 징수합니다. https://www.macrumors.com/2024/01/16/us...

Date2024.01.18 소식 By낄낄 Reply1 Views440

Read More
구글, 시크릿 모드의 면책 조항을 업데이트

구글이 최근 시크릿 모드의 데이터 수집 관련 면책 조항을 업데이트했습니다. 시크릿 모드로 전환해도 방문 기록, 다운로드, 북마크가 저장되며, 웹사이트에서 데이터를 수집하는 방식이 바뀌지 않는다는 내용을 고지합니다. 크롬에서 시...

Date2024.01.18 소식 By낄낄 Reply8 Views1057

Read More
NTT, 분신 AI를 저렴하게 만드는 기술 발표

일본 NTT가 자사의 대규모 언어 모델인 tsuzumi의 확장 기술을 발표했습니다. 소량의 대화 데이터에서 개인의 어조와 말투 등을 특정해 내 대화를 만들어낼 수 있습니다. 또 소량의 음성 데이터로 목소리 특징을 반영한 음성을 합성해내는...

Date2024.01.18 소식 By낄낄 Reply1 Views425

Read More
Beyond3D 포럼 폐쇄

한때 유명 리뷰 사이트였던 Beyond3D가 하드웨어 포럼을 폐쇄한데 이어 포럼 전체의 문을 닫습니다. 사이트에 컨텐츠가 안 올라오고 커뮤니티만 남으면 결국은 퍠쇄될 수밖에 없을 것 같네요. 옛날에 파코즈가 잘 나가던 시절에 여기도 꽤...

Date2024.01.18 소식 By낄낄 Reply1 Views509

Read More
성인게임 실행파일 위장 악성코드 주의

안랩에서는 야한게임 실행파일로 위장해 유포하는 사례를 발견했다고 합니다. 공격자는 압축해제후 'Game.exe' 파일을 실행하면 공격자의 서버로부터 악성코드를 내려받는 '다운로더 악성코드'가 함께 실행됩니다. 그와...

Date2024.01.17 소식 By툴라 Reply8 Views589

Read More
No Image

애플, 유럽을 위해 앱 스토어를 2개로 분리?

애플이 앱 사이드로딩을 강제하는 유럽 지역의 디지털 시장법을 지키기 위해 앱 스토어를 분리할 거라고 합니다. 유럽 지역 앱 스토어를 다른 지역과 별도로 떼어내서 운영하겠다는 것입니다. 앱 스토어를 분리하면 운영도 정말 번거로울...

Date2024.01.17 소식 By낄낄 Reply6 Views822

Read More
MS 코파일럿 프로 AI 발표. 구독형 오피스 AI 서비스

마이크로소프트가 코파일럿 프로를 발표했습니다. 마이크로소프트 365 퍼스널/홈 구독에 매달 20달러식 더 내면 추가되는 기능으로, AI를 오피스 앱에서 직접 넣어 쓸 수 있습니다. 여기에는 AI가 만든 문장 제안/요약, 엑셀의 분석 자동...

Date2024.01.17 소식 By낄낄 Reply0 Views455

Read More
No Image

불법 사이트 접속차단 후 우회 접근까지 감시 의무화

이번 법 개정에 따라 국내에 데이터를 임시저장 하는 서버를 설치·운영하는 일정 규모 이상의 정보통신 서비스 제공자는 임시저장 서버의 불법 정보에 대한 신속한 접근제한, 불법 정보 게재자에 유통금지 요청, 관리 실태 자동 기...

Date2024.01.17 소식 By낄낄 Reply7 Views1660

Read More