Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 챗지피티
- feature scaling
- 프롬프트 엔지니어링
- Supervised Learning
- Unsupervised Learning
- nlp
- Regression
- GPT
- 인공지능
- ML
- feature engineering
- neural network
- LLM
- prompt
- AI 트렌드
- Deep Learning
- learning algorithms
- 머신러닝
- Andrew Ng
- Scikitlearn
- AI
- 딥러닝
- 인공신경망
- 언어모델
- llama
- bingai
- Machine Learning
- ChatGPT
- supervised ml
- coursera
Archives
- Today
- Total
My Progress
[NLP] GPT-4 성능하락 관련 논문 요약 본문
반응형
1. 연구목적:
GPT-4와 GPT-3.5의 2023 3월과 6월에 스냅샷 된 두가지 버전사이의 변화 측정
2. 연구방법
4가지 작업에 대해서 평가
1. 수학문제풀이: 정확도비교
2. 민감하거나 위험한 질문에 대한 답변: 답변률
3. 코드생성: 생성된 코드로 직접 실행 가능여부
4. 시각적 추론: 정확성
추가 측정 방법:
1. 생성길이
2. 답변이 일치하는지에 대한 중복성과 일관성
3. 4가지 작업에 대한 비교 평가
4. 연구 결과
- GPT-3.5와 GPT-4의 행동이 짧은 시간 동안 상당히 변했다는 것을 확인했다.
- 대형 언어 모델의 행동을 지속적으로 평가하고 검증해야한다
반응형
'Research' 카테고리의 다른 글
GPU (0) | 2023.07.27 |
---|---|
[NLP] Prompt Engineering / 프롬프트 엔지니어링 (0) | 2023.07.26 |
[NLP] 2023 Summer LLM/언어모델 시장 트렌드 (0) | 2023.07.26 |
[NLP] 언어모델에 대해서 (0) | 2023.07.26 |