DeepSeek adalah perusahaan kecerdasan buatan asal China yang mengembangkan model bahasa besar (LLM) dan menjadi pesaing serius bagi ChatGPT. DeepSeek menawarkan chatbot gratis dengan kemampuan yang mirip, serta telah menciptakan inovasi dalam kecepatan inferensi modelnya. Model Unggulan DeepSeek
-
DeepSeek-V3:
- Dirilis pada Desember 2024.
- Memiliki 671 miliar parameter, dengan 37 miliar parameter aktif per token.
- Dirancang untuk tugas umum seperti menjawab pertanyaan sehari-hari dan menghasilkan konten kreatif.
- Mampu menangani jendela konteks hingga 128.000 token.
-
DeepSeek-R1:
- Diluncurkan pada Januari 2025.
- Menggunakan teknik reinforcement learning untuk meningkatkan kemampuan penalaran dan pemecahan masalah kompleks.
- Kapasitas output hingga 32.000 token, ideal untuk analisis mendalam dan pemrograman.
Pendekatan Teknologi
-
Mixture-of-Experts (MoE):
- Memungkinkan model untuk hanya mengaktifkan parameter yang diperlukan, sehingga lebih efisien dalam penggunaan sumber daya.
-
Chain-of-Thought (CoT):
- Memecah pertanyaan kompleks menjadi langkah-langkah kecil, menghasilkan respons yang lebih logis dan akurat.
Keunggulan dan Efisiensi
-
Biaya Pelatihan:
- DeepSeek-R1 dilatih dengan biaya sekitar 6 juta dollar AS, jauh lebih rendah dibandingkan dengan model AI lainnya seperti GPT-4 yang bisa mencapai 63 juta dollar AS.
-
Kinerja:
- DeepSeek-V3 mencetak skor tinggi dalam berbagai tolok ukur, seperti DROP dan MATH-500, mengungguli banyak model AI lainnya.
Dampak di Pasar
- DeepSeek telah menarik perhatian global dengan pendekatan inovatifnya, mendorong perusahaan lain untuk meningkatkan efisiensi model mereka.
- Meskipun merupakan pemain baru, DeepSeek telah membawa perubahan signifikan dalam persaingan teknologi AI, terutama antara Tiongkok dan Amerika Serikat.