DeepSeek: Panduan Lengkap Aplikasi Chatbot AI
DeepSeek: Everything you need to know about the AI chatbot app https://techcrunch.com/2025/01/28/deepseek-everything-you-need-to-know-about-the-ai-chatbot-app/

By Sang Ruh 29 Jan 2025, 18:03:24 WIB | 👁 3 Programming
DeepSeek: Panduan Lengkap Aplikasi Chatbot AI

Keterangan Gambar : DeepSeek: Panduan Le


DeepSeek: AI Lab yang Menghantam Peringkat Aplikasi di App Store Apple

Lab AI Cina, DeepSeek, telah menjadi sorotan utama di kesadaran umum ini minggu ini setelah aplikasi chatty-nya naik ke peringkat atas App Store Apple. Model AI DeepSeek, yang dididik menggunakan teknik yang efisien dalam penggunaan komputasi, telah membuat analis Wall Street dan teknologi mempertanyakan apakah Amerika Serikat dapat menjaga posisinya di balik permainan AI dan apakah permintaan chip AI akan terus berlanjut.

Asal Usul DeepSeek

DeepSeek didirikan oleh High-Flyer Capital Management, sebuah dana hedge yang Cina menggunakan AI untuk memandu keputusan dagangnya. Pendiri High-Flyer, Liang Wenfeng, seorang penggemar AI, mendirikan perusahaan tersebut pada tahun 2015. Wenfeng, yang sebelumnya memulai berdagang sambil belajar di Universitas Zhejiang, meluncurkan High-Flyer Capital Management sebagai dana hedge pada tahun 2019 yang fokus pada mengembangkan dan mengimplementasikan algoritma AI.

Pada tahun 2023, High-Flyer memulai DeepSeek sebagai laboratorium yang didedikasikan untuk mempelajari alat-alat AI terpisah dari bisnis keuangan perusahaan. Dengan High-Flyer sebagai investor, laboratorium tersebut berubah menjadi perusahaan yang sama bernama DeepSeek.

Teknologi yang Mendukung

Dari awal, DeepSeek membangun sentral data cluster sendiri untuk pelatihan model. Namun, seperti perusahaan AI lainnya di Cina, DeepSeek telah dipengaruhi oleh larangan ekspor Amerika Serikat pada peralatan. Untuk melatih salah satu model terbaru, perusahaan tersebut terpaksa menggunakan chip Nvidia H800, versi yang lebih lemah dari chip H100 yang tersedia untuk perusahaan di Amerika Serikat.

Tim teknis DeepSeek dikatakan memiliki skema yang muda. Perusahaan tersebut mengutamakan merekrut peneliti AI dokter dari universitas-universitas terkemuka di Cina. DeepSeek juga merekrut orang-orang tanpa latar belakang komputer untuk membantu teknologi perusahaan memahami berbagai topik, menurut The New York Times.

Model yang Kuat

DeepSeek mengumumkan setelan model pertamanya, yaitu DeepSeek Coder, DeepSeek LLM, dan DeepSeek Chat, pada November 2023. Namun, tidak sampai musim semi terakhir, ketika perusahaan meluncurkan keluarga model terbaru DeepSeek-V2, bahwa industri AI mulai memperhatikan.

DeepSeek-V2, sistem analisis teks dan gambar umum yang dapat digunakan, menunjukkan hasil yang baik dalam berbagai benchmark AI. Model ini juga lebih murah untuk dijalankan daripada model yang kompetitif pada saat itu. Hal ini membuat perusahaan kompetitor domestik, termasuk ByteDance dan Alibaba, untuk menurunkan harga penggunaan beberapa model mereka dan membuat model lainnya gratis.

DeepSeek V3: Model yang Menghantam

Pada Desember 2024, DeepSeek meluncurkan DeepSeek V3, yang hanya menambahkan kepopuleran perusahaan tersebut.

Menurut tes benchmark internal DeepSeek, DeepSeek V3 mengalahkan model yang tersedia secara terbuka, seperti Meta's Llama, dan model tertutup yang hanya dapat diakses melalui API, seperti OpenAI's GPT-4o.

Model R1: Model Penalaran yang Kuat

Pada Januari, DeepSeek meluncurkan model R1, yang menunjukkan kemampuan penalaran yang kuat. Menurut DeepSeek, R1 menunjukkan hasil yang sama dengan model OpenAI o1 pada benchmark utama.

Model R1 memiliki kemampuan untuk memeriksa dirinya sendiri, yang membantu menghindari kesalahan yang biasanya menghantam model. Model penalaran ini memerlukan waktu yang lebih lama, biasanya beberapa detik hingga menit, untuk mencapai solusi dibandingkan dengan model non-penalaran biasa. Namun, model ini lebih stabil dalam domain seperti fisika, ilmu pengetahuan, dan matematika.

Dampak yang Besar

Meskipun DeepSeek memiliki model yang kuat, namun perusahaan tersebut masih memiliki beberapa keterbatasan. Model yang dikembangkan oleh perusahaan tersebut, R1, G, dan V3, masih diperlakukan oleh regulator internet Cina untuk memastikan bahwa responsnya "mengandung nilai sosialis." Dalam aplikasi chatty perusahaan, R1 tidak akan menjawab pertanyaan tentang Tiananmen Square atau kemerdekaan Taiwan.

Menghantam Peringkat Aplikasi di App Store Apple

Jika DeepSeek memiliki model bisnis, maka tidak jelas apa itu. Perusahaan tersebut menawarkan produk dan layanan dengan harga yang sangat rendah dan memberikan yang lain untuk gratis.

Meskipun demikian, pengembang telah terinspirasi oleh model DeepSeek, yang tidak tersedia secara terbuka seperti biasanya tetapi tersedia di bawah lisensi yang memungkinkan penggunaan komersial. Menurut Clem Delangue, CEO Hugging Face, pengembang di Hugging Face telah menciptakan lebih dari 500 "derivative" model R1 yang telah diunduh secara bersamaan sebanyak 2,5 juta kali.

Dampak yang Besar

Sukses DeepSeek melawan perusahaan yang lebih besar dan lebih terestris adalah "menghantam AI" dan membawa "abadan baru dari AI brinkmanship." Sukses perusahaan tersebut juga menyebabkan harga saham Nvidia turun 18% pada Senin dan menyebabkan respons publik dari CEO OpenAI, Sam Altman.

Namun, apa yang akan menjadi masa depan DeepSeek? Tidak ada yang jelas. Namun, perusahaan tersebut pasti akan terus mengembangkan model yang lebih baik.

View all comments

Write a comment