본문 바로가기

AI3

2023년 4월 3주 인공지능 기술 동향 LLM AI Agent프로젝트가 주목을 받고 있습니다. AI Agent프로젝트가 본격적으로 시작되고 있습니다. AutoGPT와 같은 프로젝트는 '역사상 가장 빠르게 성장하는 GitHub프로젝트로 평가받고 있습니다. BabyAGI, AgentGPT와 같은 유사한 프로젝트도 급속도로 활성화되고 있습니다. AI Agent는 GPT와 같은 언어모델을 이용하여 실제 업무상의 다양한 문제점을 해결하거나 자동으로 업무를 수행하고자 하는 프로젝트입니다. (As AI agents like Auto-GPT speed up generative AI race, we all need to buckle up | The AI Beat | VentureBeat) 물론 AutoGPT의 초기 성과가 과대 평가되어 있다는 의견도 있습니다.. 2023. 4. 23.
2023년 4월 2주 인공지능 기술동향 LLM 구글, 'Bard에 대하여:시작단계의 생성형 AI실험' Databrics, Dolly 2.0 오픈소스로 공개. 세계 최초의 진정한 개방형 인스트럭션 튜닝 LLM을 소개합니다. 가트너, ChatGPT에 대한 7가지 가장 큰 궁금증에 대한 답변 Microsoft, ChatGPT유사 모델을 쉽고 빠르게 학습할 수 있게 해주는 최적화 라이브러리 DeepSpeed공개. DeepSpeed Chat: 모든 규모의 ChatGPT유사 모델에 대해 쉽고 빠르며, 경제적인 RLHF 학습 DeepSpeed Chat Github LLaMA, GPT-J, GPT-2, OPT, Cerebras-GPT, Galactica 등과 같은 LLM을 빠르고 효율적이며 간단하게 미세 조정할 수 있도록 지원하는 오픈소스 프로젝트 xTur.. 2023. 4. 16.
[번역] StackLLaMA: RLHF로 LLaMA를 학습시키기 위한 실습 가이드 이 글의 원문은 StackLLaMA: A hands-on guide to train LLaMA with RLHF입니다 ChatGPT, GPT-4, Claude와 같은 모델들은 인간 피드백에 의한 강화 학습(RLHF)이라고 하는 방법을 통해 우리가 원하고 사용하려는 방식에 잘 맞게 파인튜닝된 강력한 언어모델입니다 이 블로그 포스트에서는, 우리는 아래 기술을 조합해 RLHF와 Stack Exchange의 질문/답 데이터를 가지고 LLaMA모델 학습을 진행한 내용을 설명합니다. 슈퍼바이즈드 파인튜닝 Supervised Fine-tuning (SFT) 보상-선호 모델링 Reward / preference modeling (RM) 인간 피드백에 의한 강화 학습 Reinforcement Learning from H.. 2023. 4. 16.