Groq의 LPU 추론 엔진. GPU보다 빠름

조회 수 836 댓글 0

Extra Form
참고/링크	https://www.techradar.com/pro/feels-like...checkbooks

Groq의 LPU 추론 엔진이 탑재된 카드입니다. GPU보다 빠르게 LLM 대규모 언어 모델을 처리하도록 설계됐습니다. 오직 LLM에만 초점을 맞췄기에 효율도 높다고 하네요.

1개의 단어당 필요한 계산 시간을 줄이고 텍스트 시퀸스를 빠르게 생성할 수 있습니다. 무엇보다 80TB/s의 대역폭으로 230MB의 SRAM만 사용하며 비싼 HBM 메모리를 필요로 하지 않는다고 합니다.

아래는 Llama 2/Mixtral LLM과 OpenAI의 Chat-GPT 실행 영상입니다. 1초도 안되는 시간에 텍스트를 생성하고, 대부분은 관련 정보를 검색하는데 사용합니다.

삭제 요청

TAG •

lpu,
ai,

목록 스크랩

위로 아래로 댓글로 가기

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.

No Image

드디어 한국에도 로지텍 리프트 왼손잡이용 마우스 정발하였습니다.

이름은 리프트 레프트입니다. 3월 말에 출시되었는데 얼마 전에 알아서 오늘 수령하고 사용 중입니다.

Date2024.04.03 소식 ByGPT Reply0 Views494

Read More
No Image

마이크론, 중국에 새로운 패키징/테스트 공장을 건설

마이크론이 중국 시안 지역에 새로운 패키징/테스트 공장을 건설합니다. 중국 정부는 마이크론의 중국 내 판매를 공식 금지했습니다. 미국의 중국 규제에 맞선 반격입니다. 중국 안에서 사업 자체는 가능하지만 상당 부분 제한이 됩니다 ....

Date2024.04.03 소식 By낄낄 Reply0 Views742

Read More
MSI PRO A620M-C EX. 레거시 포트가 달린 AM5 보드

MSI PRO A620M-C EX 메인보드입니다. A620 칩셋, DDR5-7800 슬롯 2개에 최대 128GB 장착, M.2 슬롯 2개, SATA 6Gbps 4포트, PCIe 4.0 x16 1슬롯, PCIe 3.0 x1 2슬롯, 리얼텍 RTL8111H 기가비트 랜, 리얼텍 ALC897 오디오, 마이크로 ATX 폼...

Date2024.04.03 소식 By낄낄 Reply24 Views1674

Read More
스팀의 24년 3월 그래픽카드 점유율, 3060이 1위

스팀의 24년 3월 그래픽카드 점유율입니다. 지포스 RTX 3060이 굳건하게 1위를 차지하고 있으며 2위는 2060입니다. 그 아래를 봐도 3070과 4070만 빼면 대체로 60 정도 급의 보급형 지포스 뿐이네요.

Date2024.04.03 소식 By낄낄 Reply8 Views640

Read More
ASUS, ROG 묠니르 이동식 발전소를 예고

ASUS가 ROG 묠니르 이동식 발전소를 예고했습니다. 만우절 거짓말이 아니라 진짜입니다. USB-A 2개, USB-C 2개, 4개의 110V 전원 콘센트가 있습니다. 용량이나 스펙에 대해서는 알려지지 않았습니다. 무엇보다 저 손잡이가 달려서 출시되...

Date2024.04.03 소식 By낄낄 Reply10 Views1869

Read More
AMD, 라이젠 임베디드 8000 시리즈 발표

AMD가 라이젠 임베디드 8000 시리즈를 발표했습니다. 산업용 AI NPU가 통합됐다고 말은 하는데, 그냥 라이젠 8000 모바일 프로세서 중 NPU 탑재 모델을 라이젠 임베디드로 출시했다고 보면 되겠네요. 라인업은 이렇습니다.

Date2024.04.03 소식 By낄낄 Reply0 Views616

Read More
라이젠 7x35H, 내장 그래픽이 없는 모바일 APU

AMD가 라이젠 5 7235H, 7235HS, 라이젠 7 7435H, 7435HS를 추가했습니다. 공통 스펙은 렘브란트 리프레시, 젠3+ 코어, 내장 그래픽 비활성화가 특징입니다. 라이젠 5 7235HS https://www.amd.com/en/product/14306 라이젠 5 7235H https:...

Date2024.04.02 소식 By낄낄 Reply23 Views1458

Read More
No Image

CEO가 받는 돈. 인텔이 AMD의 절반

인텔의 CEO인 팻 겔싱어는 회사에서 받는 돈이 크게 늘었습니다. 2022년 1161만 달러에서 2023년 1686만 달러로 45%가 증가했는데요. '월급'이나 '연봉'도 아니고 '회사에서 받는 돈'이라고 길게 쓴 이유는, 기본...

Date2024.04.02 소식 By낄낄 Reply7 Views2251

Read More
No Image

HP, 러시아에서 철수

HP가 미국의 제재 조치에 따라 러시아에서 완전히 철수했습니다. 러시아 지역의 드라이버 배포 사이트를 폐쇄하고, 국가/지역 목록에서 러시아를 삭제했습니다. 러시아 웹사이트는 러시아어를 사용하는 다른 나라인 카자흐스탄으로 리다이...

Date2024.04.01 소식 By낄낄 Reply7 Views1583

Read More
애즈락, LP 타입 라데온 RX 550 출시

애즈락이 라데온 RX 550 LP 4GB를 출시했습니다. 크기 170x69mm, 듀얼 슬롯, 듀얼 팬, 보조 전원 없음. 512개의 스트림 프로세서, 클럭 1100MHz, 128비트 6Gbps 96GB/s 메모리. 폴라리스는 단종됐지만 여전히 재고 칩이 남아 있나 봅니다.

Date2024.04.01 소식 By낄낄 Reply16 Views1187

Read More
애로우레이크는 코어 울트라 200, 랩터레이크-H 리프레시는 코어 200H

애로우레이크는 코어 울트라 200, 랩터레이크-H 리프레시는 코어 200H으로 출시될 거라고 합니다. 앞으로 나올 제품은 코어 i의 이름은 안 쓰나 봅니다. 랩터레이크 리프레시에서도 i를 떼버렸으니까요.

Date2024.04.01 소식 By낄낄 Reply3 Views728

Read More
10년 안에 1조 개의 트랜지스터를 지닌 칩이 나온다

IEEE Spectrum은 앞으로 10년 안에 1조 개의 트랜지스터를 지닌 칩이 나올 것으로 예측하고 있습니다. 칩이라고는 해도 AI 연산용 GPU지요. AI 혁명을 위해 더 큰 칩이 필요하다는 이유에서입니다. 앞으로는 하나의 칩에 더 많은 트랜지스...

Date2024.04.01 소식 By낄낄 Reply5 Views1126

Read More
인텔 아크 배틀메이지 Xe2-HPG BMG-10, BMG-21이 배송됨

인텔 아크 배틀메이지 Xe2-HPG BMG-10, BMG-21의 샘플이 배송된 것으로 보입니다. 알케미스트의 후속작인 배틀메이지는 올해 하반기에 나온다고 알려져 있습니다.

Date2024.04.01 소식 By낄낄 Reply0 Views505

Read More
No Image

젠5, 젠4보다 40% 빠르다?

SPEC 벤치마크에서 젠5 코어의 성능이 젠4보다 40% 높다고 합니다. 이게 최대인지 평균인지는 모릅니다. 엑스케베이터에서 젠1으로 갔을 때 52% 향상이었으니까, 이 정도면 아키텍처가 다 엎어진 수준입니다.

Date2024.04.01 소식 By낄낄 Reply15 Views2611

Read More
애로우/루나레이크는 당초 발표랑 달리 TSMC N3 베이스일지도 모른다

뭐 원 기사 출처가 평소에 썩 이미지가 좋지 않은 Areej이긴 한데요. 하튼 당초 인텔이 발표한 로드맵에선 20A 애로우레이크, 18A 루나레이크로 되어 있었으나, 이게 원래 발표에서 틀어져서 전부 다 TSMC의 N3 베이스일지도 모른다는...

Date2024.04.01 소식 By류오동 Reply9 Views1635

Read More
YMTC의 3D QLC 낸드 플래시, TLC 수준의 수명 확보

YMTC X3-6070 3D QLC 낸드 플래시 칩입니다. 3세대 X트래킹 아키텍처에 128단으로 적층 수는 많지 않습니다. 하지만 소재 혁신, 오류 수정 알고리즘, 컨트롤러 최적화를 통해 4000 P/E 사이클을 유지할 수 있다고 합니다. 이건 TLC 수준의...

Date2024.03.30 소식 By낄낄 Reply16 Views1721

Read More
AMD 그래닛 릿지, 스트릭스 포인트, 파이어 레인지의 ES가 발송

AMD 그래닛 릿지의 ES가 발송됐습니다. 6코어 105W A0과 8코어 170W B0가 있습니다. 모두 젠5 아키텍처입니다. https://twitter.com/momomo_us/status/1773392771149402125 https://twitter.com/momomo_us/status/1773391111069094318 스...

Date2024.03.30 소식 By낄낄 Reply8 Views1088

Read More
가장 느린 메테오레이크, 코어 울트라 5 115U가 추가

인텔이 메테오레이크를 발표했을 때엔 목록에 없던 코어 울트라 5 115U가 제품 페이지에 등록됐습니다. https://www.intel.com/content/www/us/en/products/sku/237505/intel-core-ultra-5-processor-115u-10m-cache-up-to-4-20-ghz/speci...

Date2024.03.30 소식 By낄낄 Reply2 Views809

Read More
커브드 AMOLED가 달린 일체형 수냉 쿨러

커브드 AMOLED 스크린이 달린 일체형 수냉 쿨러입니다. 화면 크기 6.5인치, 8세대 아세텍 펌프가 있습니다. 가격은 240mm 기준 290달러부터 360mm는 373달러까지 있습니다.

Date2024.03.30 소식 By낄낄 Reply3 Views796

Read More
라데온 RX 7600 레퍼런스 모델 판매 개시

라데온 RX 7600 레퍼런스 모델이 판매를 시작했습니다. Made by AMD라는 이름으로 레퍼런스 디자인을 출시하며 가격은 269달러입니다. 7600 발표 당시에 레퍼런스를 팔겠다고 했는데 출시까지 시간이 꽤 오래 걸렸군요.

Date2024.03.30 소식 By낄낄 Reply0 Views539

Read More