DeepSeek یک پلتفرم هوش مصنوعی پیشرفته چینی است که در سال ۲۰۲۳ تأسیس شده و با هدف رقابت با شرکتهای بزرگی مانند OpenAI و گوگل فعالیت میکند. این فناوری بر پایه مدلهای زبانی بزرگ با معماری Mixture of Experts (MoE) ساخته شده که در آن تنها بخشی از مدل در هر پردازش فعال میشود تا مصرف منابع کاهش و کارایی افزایش یابد. DeepSeek دارای ویژگیهای برجستهای مثل سرعت بالا در پردازش، دقت بالا در پاسخها، توانایی درک و تولید کدهای برنامهنویسی و حل مسائل ریاضی پیچیده است. این پلتفرم به صورت رایگان و متنباز عرضه شده و توسعهدهندگان میتوانند آن را در پروژههای تحقیقاتی و تجاری خود استفاده کنند. نسخه جدید این مدل با نام DeepSeek V3 در سال ۲۰۲۴ معرفی شده و با بهرهگیری از 671 میلیارد پارامتر و آموزش روی دادههای عظیم، به عنوان یکی از مدلهای قدرتمند هوش مصنوعی مطرح شده است. DeepSeek توانسته توجه زیادی را در حوزه فناوری و بازارهای مالی جلب کند و برخلاف محدودیتها، با مصرف منابع کمتر، عملکردی رقابتی ارائه دهد.