파이토치 한국 사용자 모임 (PyTorch Korea User Group)

July 30, 2024

토치챗(torchchat) 소개: 노트북, 데스크탑 및 모바일에서 로컬 LLM 추론 가속화하기

오늘 노트북과 데스크탑, 모바일에서 Llama 3와 3.1, 그리고 다른 대규모 언어 모델(LLM, Large Language Model)을 원활하고 고성능으로 실행하는 방법을 보여주는 라이브러리인 torchchat을 출시했습니다. Today, we’re releasing torchchat, a library showcasing how to seamlessly and performantly run Llama 3, 3.1, and other large language models across laptop, desktop, and mobile. 이전...

더 읽어보기 →

July 11, 2024

FlashAttention-3: 비동기 및 저정밀도에서의 빠르고 정확한 어텐션 제공

어텐션(Attention)은 트랜스포머(Transformer) 구조의 핵심 계층(layer)이지만, 대규모 언어 모델(LLM, Large Language Model)과 긴-컨텍스트 애플리케이션(long-context application)의 병목(bottleneck)이기도 합니다. FlashAttention (및 FlashAttention-2)은 메모리 읽기/쓰기를 최소화하여 GPU에서 어텐션 연산을 가속화하는 방법을 개척했으며, 이제 대부분의 라이브러리에서 트랜스포머(Transformer) 학습 및 추론을 가속화하는데 사용되고 있습니다. 이 덕분에 지난 2년 동안 LLM 컨텍스트 길이가 2-4K(GPT-3, OPT)부터 128K(GPT-4) 및...

더 읽어보기 →

June 23, 2024

PyTorch로 전문가 혼합(MoE) 모델 학습 확장하기

최근 1년간 전문가 혼합(MoE, Mixture-of-Experts) 모델들의 인기가 급증했습니다. 이러한 인기는 DBRX, Mixtral, DeepSeek를 비롯하여 다양하고 강력한 오픈소스 모델들로부터 비롯된 것입니다. Databricks에서는 PyTorch 팀과 협력하여 MoE 모델의 학습을 확장했습니다. 이번 글에서는 PyTorch Distributed 및 PyTorch로 구현한 효율적인 오픈소스 MoE 구현체인 MegaBlocks를 사용하여 학습을 3천개 이상의 GPU들로 확장하는 방법에 대해 이야기해보겠습니다. Over...

더 읽어보기 →

April 24, 2024

PyTorch 2.3 출시 공지

PyTorch® 2.3(릴리즈 노트)의 출시를 발표하게 되어 기쁩니다! PyTorch 2.3은 torch.compile()에서 사용자 정의(user-defined) Triton 커널을 지원합니다. 사용자들은 성능 저하나 연산 그래프의 문제 없이 자체 트리톤 커널을 eager 모드에서 torch.compile()로 이전(migration)할 수 있습니다. Tensor Parallelism(텐서 병렬 처리)은 PyTorch 네이티브 함수를 사용하여 대규모 언어 모델(LLM, Large Language Models)을 학습하는 환경을 개선하였으며, 이는 1000억개...

더 읽어보기 →

April 16, 2024

torchtune: PyTorch를 사용한 쉬운 LLM 파인튜닝

대규모 언어 모델(LLM)을 손쉽게 파인튜닝(미세조정)할 수 있는 PyTorch 네이티브 라이브러리인 torchtune의 알파 릴리즈를 발표하게 되어 기쁩니다. We’re pleased to announce the alpha release of torchtune, a PyTorch-native library for easily fine-tuning large language models. torchtune은 파이토치(PyTorch)의 설계 원칙을 충실히 따랐으며, 다양한 소비자급 및 전문가용 GPU에서 인기있는 LLM들을 파인튜닝할 수 있도록...

더 읽어보기 →

February 06, 2024

PyTorch 2 논문 및 튜토리얼 @ ASPLOS 2024

2024년 4월 27일부터 5월 1일까지 미국 캘리포니아주 샌디에이고에서 열릴 예정인 ACM 국제 컨퍼런스 ASPLOS(Architectural Support for Programming Languages and Operating Systems)에서 PyTorch 2에 대한 논문이 선정되어 발표하게 되었다는 소식을 전할 수 있어 기쁘게 생각합니다. The PyTorch team is excited to share that our paper on PyTorch 2 has been accepted...

더 읽어보기 →

November 29, 2023

PyTorch 2.1에 새로 추가된 성능 향상 기능 소개

PyTorch(파이토치) 2.1을 출시하여 매우 기쁩니다. 이번 글에서는 PyTorch 2.1에 인텔(Intel)이 크게 기여한 다섯가지 기능들에 대해서 설명하겠습니다: We are excited to see the release of PyTorch 2.1. In this blog, we discuss the five features for which Intel made significant contributions to PyTorch 2.1: torch.compile()시 bfloat16 추론 경로를 포함하는 TorchInductor-CPU 최적화...

더 읽어보기 →

블로그

토치챗(torchchat) 소개: 노트북, 데스크탑 및 모바일에서 로컬 LLM 추론 가속화하기

FlashAttention-3: 비동기 및 저정밀도에서의 빠르고 정확한 어텐션 제공

PyTorch로 전문가 혼합(MoE) 모델 학습 확장하기

PyTorch 2.3 출시 공지

torchtune: PyTorch를 사용한 쉬운 LLM 파인튜닝

PyTorch 2 논문 및 튜토리얼 @ ASPLOS 2024

PyTorch 2.1에 새로 추가된 성능 향상 기능 소개

PyTorch 설치하기

클라우드에서
빠르게 시작하기

PyTorchKorea @ GitHub

한국어 튜토리얼

한국어 커뮤니티

블로그

토치챗(torchchat) 소개: 노트북, 데스크탑 및 모바일에서 로컬 LLM 추론 가속화하기

FlashAttention-3: 비동기 및 저정밀도에서의 빠르고 정확한 어텐션 제공

PyTorch로 전문가 혼합(MoE) 모델 학습 확장하기

PyTorch 2.3 출시 공지

torchtune: PyTorch를 사용한 쉬운 LLM 파인튜닝

PyTorch 2 논문 및 튜토리얼 @ ASPLOS 2024

PyTorch 2.1에 새로 추가된 성능 향상 기능 소개

PyTorch 설치하기

클라우드에서 빠르게 시작하기

PyTorchKorea @ GitHub

한국어 튜토리얼

한국어 커뮤니티

클라우드에서
빠르게 시작하기