본문 바로가기

전체 글143

ChatGPT과 Langchain를 이용한 나만의 지식검색 챗봇 만들기 지난 포스팅에서 Langchain을 이용한 비즈니스 애플리케이션을 만들기 위해 고민해야 할 점들에 대해 이야기했었습니다. 이번 포스팅에서는 실제로 Langchain을 이용한 비즈니스 애플리케이션이라는 콘셉트로 만든 '나만의 지식검색 챗봇'에 대한 간단한 소개와 데모를 보여드리겠습니다. 기획 의도 '나만의 지식검색 챗봇'은 사실 개인적으로 활용하기 위한 용도로 기획하였습니다. 거의 매일 여러 IT뉴스나 블로그 포스팅을 읽고 있는데 그중에 보관하고 나중에도 읽어볼 만한 링크는 텔레그램에 저장하여 나중에 다시 검색해서 읽곤 하였습니다. (에버노트나 포켓도 사용해 봤지만 PC/모바일 환경에서 가장 간단하게 사용하기에는 개인적으로 텔레그램이 가장 좋았습니다) 하지만 텔레그램의 검색기능이 한글 검색에서는 한계가 있.. 2023. 6. 3.

2023년 4월 4주 인공지능 기술 동향 LLM Stability.ai에서 오픈소스 RLHF LLM 챗봇 StableVicuna를 발표했습니다. LLaMA 13b모델을 기반으로 RLHF방식을 파인튜닝 모델을 사용한다고 합니다. vicuna도 성능이 꽤 좋아서 주목을 받았는데, StableVicuna는 어떤 성능을 보여줄지 기대가 됩니다. 언어모델을 기반으로 한 애플리케이션 개발 프로젝트가 점점 많아지고 있습니다. LLaMA Academy는 LLaMA모델, LoRA기술, LangChain프레임워크등을 활용하여 GPT가 API를 호출하도록 가르칩니다. 특정 API를 지정하면 해당 API를 학습한 LLaMA모델이 생성되며 API를 이용하길 원하는 기능을 입력하면 구현된 코드를 응답해 줍니다. griptape는 LLM파이프라인 DAG를 작성하여 워크플.. 2023. 4. 29.

LangChain을 이용한 비즈니스 어플리케이션을 고민하다 ChatGPT의 등장 이후, 인공지능 업계에서는 ChatGPT 어떻게 비즈니스에 활용할지에 대해 많은 고민들이 있었습니다. 일반인들 입장에서는 ChatGPT만으로도 충분히 재미있고 작문, 취미, 업무 등에 도움이 될 수 있지만 비즈니스 입장에서 ChatGPT는 재미있는 장난감일 뿐, 비즈니스 애플리케이션으로 활용하기에는 환각(Hallucination)과 같은 신뢰성 문제가 치명적인 단점이었기 때문입니다. 이런 신뢰성 문제 때문에 ChatGPT이전에도 생성형 챗봇을 비즈니스에 도입하려는 시도들이 있었지만, 결국 비즈니스 영역에서는 사전에 사람에 의해 구축된 지식을 바탕으로 사용자의 질의를 분석한 뒤 정해진 답변을 하는 '분류형 챗봇'을 활용하는 수준에 그치고 있었습니다. 그러나 ChatGPT등장 이후, C.. 2023. 4. 28.

2023년 4월 3주 인공지능 기술 동향 LLM AI Agent프로젝트가 주목을 받고 있습니다. AI Agent프로젝트가 본격적으로 시작되고 있습니다. AutoGPT와 같은 프로젝트는 '역사상 가장 빠르게 성장하는 GitHub프로젝트로 평가받고 있습니다. BabyAGI, AgentGPT와 같은 유사한 프로젝트도 급속도로 활성화되고 있습니다. AI Agent는 GPT와 같은 언어모델을 이용하여 실제 업무상의 다양한 문제점을 해결하거나 자동으로 업무를 수행하고자 하는 프로젝트입니다. (As AI agents like Auto-GPT speed up generative AI race, we all need to buckle up | The AI Beat | VentureBeat) 물론 AutoGPT의 초기 성과가 과대 평가되어 있다는 의견도 있습니다.. 2023. 4. 23.

Stability.ai, 공개 언어모델 StableLM 공개 Stable Diffusion Moment를 불러왔던 Stable Diffusion을 만든 Stability.ai에서 마찬가지로 공개 언어모델인 StableLM을 공개하였습니다. 현재는 알파 버전으로 3B, 7B 두 개의 모델을 공개하였습니다. 향후 30B 및 65B모델도 공개한다고 합니다. 기본 모델은 CC BY-SA-4.0 라이선스(출처 표기 시 상업적으로 이용 가능)입니다. Github에 공개한 소스는 Apache2.0 라이선스입니다. 오픈 데이터셋인 Pile에 기반으로 학습했지만, 1.5T 토큰으로 3배 더 큰 규모입니다. 데이터셋에 대한 내용은 추후 공개 예정입니다. 자체 설명에 따르면 3B,7B 파라미터 모델은 규모는 작아 보이지만 성능은 좋다고 하는데, 커뮤니티 반응을 보면 vicuna가 좀.. 2023. 4. 20.

2023년 4월 2주 인공지능 기술동향 LLM 구글, 'Bard에 대하여:시작단계의 생성형 AI실험' Databrics, Dolly 2.0 오픈소스로 공개. 세계 최초의 진정한 개방형 인스트럭션 튜닝 LLM을 소개합니다. 가트너, ChatGPT에 대한 7가지 가장 큰 궁금증에 대한 답변 Microsoft, ChatGPT유사 모델을 쉽고 빠르게 학습할 수 있게 해주는 최적화 라이브러리 DeepSpeed공개. DeepSpeed Chat: 모든 규모의 ChatGPT유사 모델에 대해 쉽고 빠르며, 경제적인 RLHF 학습 DeepSpeed Chat Github LLaMA, GPT-J, GPT-2, OPT, Cerebras-GPT, Galactica 등과 같은 LLM을 빠르고 효율적이며 간단하게 미세 조정할 수 있도록 지원하는 오픈소스 프로젝트 xTur.. 2023. 4. 16.

이전 1 ··· 3 4 5 6 7 8 9 ··· 24 다음

티스토리툴바