Çinli yapay zeka şirketi DeepSeek nasıl ve neden ABD’yi sarstı?
Çinli Liang Wenfeng tarafından 2023 yılında kurulan Çinli bir yapay zeka (AI) girişimi olan DeepSeek, mevcut çözümlerle rekabet eden ve maliyetin çok daha düşük olduğu son derece verimli bir yapay zeka modeli geliştirerek, cesur ve çığır açıcı bir stratejiyle pazara girdi ve ABD borsalarını ve hisseleri sarstı.
Nvidia’nın hisse senedi fiyatı, 27 Ocak 2025’da yüzde 17’lik bir düşüşle 118,58 dolara gerileyerek şirketin piyasa değerinde yaklaşık 600 milyar dolarlık bir kayba neden oldu. Bu düşüşün ardından, 28 Ocak 2025 tarihinde Nvidia’nın hisseleri bir miktar toparlanarak 127,54 dolar seviyesine yükseldi. Ancak, bu toparlanmaya rağmen şirketin piyasa değeri, DeepSeek’in piyasaya girmesinden bu yana önemli ölçüde azalmış durumda. Bu gelişmeler, Nvidia’nın piyasa değerinde önemli bir düşüşe yol açtı ve şirketin CEO’su Jensen Huang’ın kişisel servetinde de yaklaşık 20,8 milyar dolarlık bir azalmaya neden oldu.
Sputnik Anı
DeepSeek R-1’in pazara girişi, Amerikan yapay zekası için bir “Sputnik anı” olarak tanımlandı ve sektördeki yerleşik oyuncuları altüst ediverdi. (Sputnik anı, uzaya ABD’den önce Rusya’nın uydu fırlatmasını ifade ediyor). Kısaca 3 konuda endişe yaratıyor;
- Maliyet atılımı: DeepSeek’in R-1’i, OpenAI’nin o1’ine yüzde 10 maliyetle performans açısından rakip oluyor ve uygun fiyatlı, yüksek kaliteli yapay zekaya olanak sağlıyor.
- Açık kaynaklı uç: Serbestçe kullanılabilir, mütevazı donanımlarda çalışıyor, geliştiricilerin hızla benimsemesini ve açık kaynaklı inovasyonu teşvik ediyor.
- Sektörde endişeler: Büyük teknoloji şirketleri (OpenAI, Google, Meta) ve Nvidia’nın GPU sektörü, düşük maliyetli modellerin kapalı, pahalı sistemlere meydan okumasıyla baskı altında.
DeepSeek, Ocak 2025’te AI asistanını iOS ve Android platformları için ücretsiz bir mobil uygulama olarak yayınladı. Uygulama, bir kaç gün içinde ChatGPT’yi geride bırakarak ABD iOS App Store’da en çok indirilen ücretsiz uygulama oldu. Bu hızlı benimsenme, modelin soruları yanıtlama, mantık problemlerini çözme ve diğer önde gelen sohbet robotlarıyla aynı seviyede bilgisayar programları yazma yeteneklerini gösterdi.
Maliyet verimliliğinde rakiplerini geride bıraktı
DeepSeek öncelikle, maliyet verimliliğinde rakiplerini geride bıraktı. DeepSeek’in yapay zeka modeli, OpenAI’nin GPT serisi ve benzeri ABD’li rakiplerinin maliyetinin çok daha azına geliştirildi. Ayrıca tanırımında, gelişmiş doğal dil anlayışı ve üretimi gösterdi ve mevcut en son modellerle rekabet etti veya onları aştı. Geliştirici dostu bir platform sundu. Sağlam API’ler ve araçlar sağladı ve işletmelerin DeepSeek’in teknolojisini iş akışlarına entegre etmesini kolaylaştırdı.
DeepSeek’in bir yandan da stratejik ortaklıklarla pazara girdiği görüldü. Önde gelen Çinli teknoloji devleriyle stratejik iş birlikleri. Douyin, WeChat ve Taobao gibi popüler Çin platformlarına entegrasyon, yapay zeka yeteneklerinin anında milyonlara ulaşmasını sağlıyor. Hükümet girişimleriyle ortaklıklar, onu Çin’in daha geniş AI ve teknoloji stratejisinde bir temel taşı olarak konumlandırıyor.
DeepSeek’in pazara giriş stratejisinde, ABD ve Avrupa rakiplerine kıyasla önemli ölçüde daha düşük maliyetlerle hizmet sunması, onu küçük işletmelerden büyüklere kadar çok çeşitli kullanıcılar için çekici hale getiriyor.
55 Günde 2.000 Nvidia H800 GPU Kullandı ve Sadece 5,6 milyon $ Harcadı
Şirket, belirli bir görev için yalnızca gerekli bilgi işlem kaynaklarını etkinleştiren ve hesaplama giderlerini önemli ölçüde azaltan bir “uzman karışımı” tekniğinden yararlandığı kaydediliyor. Buna göre, DeepSeek kendi modelini 55 gün boyunca yaklaşık 2.000 Nvidia H800 GPU kullanarak eğitmesine olanak tanıdı ve bu da yaklaşık 5,6 milyon dolara mal oldu. Batılı emsallerinin bütçeleri ile kıyaslanırsa, önemli ölçüde daha düşük bir maliyet.
DeepSeek’in yapay zeka asistanının lansmanı, küresel teknoloji sektöründe derin bir etki yarattı. Yatırımcılar, bu düşük maliyetli Çin yapay zeka modelinin yerleşik yapay zeka liderlerinin hakimiyetini tehdit edebileceği ve teknoloji hisselerinde önemli bir satış dalgasına yol açabileceği konusunda endişelerini dile getirdiler. Özellikle, Nvidia’nın hissesi piyasa değerinde yaklaşık 593 milyar dolarlık rekor bir günlük kayıp yaşadı.
DeepSeek neden sıcak bir konu oldu?
DeepSeek, birkaç nedenden ötürü sıcak bir konu haline geldi ve oyunun kurallarını değiştiren bir araç olarak kabul ediliyor. Çünkü veri analizi ve bilgi alma alanlarında önemli bir sıçramayı temsil ediyor. Farklarını gözden geçirelim;
- Gelişmiş Arama Yetenekleri: DeepSeek muhtemelen arama teknolojisinde devrim niteliğinde iyileştirmeler sunuyor. Basit anahtar kelime eşleştirmenin ötesine geçerek sorguların ardındaki amacı anlayabiliyor. Geleneksel sistemlerin zorlandığı çok katmanlı veya ayrıntılı soruları yanıtlayabiliyor. Son derece alakalı sonuçlar sağlayabiliyor. Kullanıcı tercihlerine, geçmiş verilere ve daha derin anlamsal anlayışa göre sonuçları uyarlayabiliyor.
- Gerçek Zamanlı Analiz: Gerçek zamanlı olarak büyük miktarda yapılandırılmamış veriyi (metin, resim, video vb.) analiz edebiliyor. Her gün terabaytlarca veriyle uğraşan sektörler için bile anında eyleme dönüştürülebilir içgörüler sunabiliyor. Geleneksel olarak bölümlere ayrılmış veri kaynaklarını entegre ederek karar vermeyi geliştirebiliyor.
- Üretken Entegrasyon: DeepSeek, üretken yapay zekayı geleneksel arama veya alma ile birleştirebiliyor. Sadece mevcut bilgileri almak yerine yeni, ilgili içgörüler üretebiliyor. Karmaşık veri kümelerini özetleyebiliyor. İnsan benzeri ve sezgisel hissettiren kişiselleştirilmiş, sohbet tarzında yanıtlar sağlayabiliyor.
- Çok Modlu Yapay Zekada Atılımlar: Çok modlu yeteneklerde, farklı veri türlerini işleme ve ilişkilendirmede (örneğin, metin, resim, ses ve videoyu sorunsuz bir şekilde birleştirme) mükemmel olabiliyor. Bu tıp (tıbbi görüntüleri hasta kayıtlarıyla birlikte analiz etme) veya hukuk (yasal metni video kanıtlarıyla ilişkilendirme) gibi alanlarda paha biçilmez olarak değerlendiriliyor. Daha akıllı, çapraz referanslı içgörülere olanak tanıyan, bağlamın daha derin bir şekilde anlaşılmasını sağlayabiliyor.
- Gelişmiş Yapay Zeka’nın Demokratikleştirilmesi: DeepSeek erişilebilirliğiyle de öne çıkabilir. Gelişmiş veri alma ve yapay zeka yeteneklerini yalnızca teknoloji devleri için değil, daha küçük işletmeler veya bireyler için kullanılabilir hale getiriyor. Teknik olmayan kullanıcıların yapay zekanın gücünden yararlanmasını kolaylaştıran sezgisel arayüzler sunuyor. Karmaşık analizler gerçekleştirmenin teknik engellerini azaltıyor.
- Belirli Endüstrilerde Devrim Yaratabilir: DeepSeek, Sağlık, Finans, Eğitim ve Arge gibi belirli endüstrilerde benzersiz bir üstünlüğe sahip olabilir. Sağlıkta, ilgili tıbbi literatürü veya kalıpları hızla belirleyerek teşhis veya araştırmada devrim yaratabilir. Yüksek frekanslı ticaret veya dolandırıcılık tespiti için gerçek zamanlı olarak piyasa eğilimlerini analiz edebilir. Ya da akademik ve bilimsel verilere daha iyi erişim sağlamak mümkün olabilir.
Yani oluşan heyecan, DeepSeek etrafındaki söylentiler büyük ihtimalle en son yapay zekayı, çok modlu yetenekleri ve kullanıcı merkezli tasarımı, bilgilere nasıl eriştiğimizi ve analiz ettiğimizi bozan bir araçta birleştirme becerisinden kaynaklanıyor.
Kim Ne Kadar Etkilenecek?
DeepSeek hangi firmayı nasıl etkileyecek? Tahminler şu şekilde;
OpenAI
OpenAI muhtemelen en çok etkilenen olacak. DeepSeek hızlı bir takipçi ve gerçekten hızlı bir şekilde takip ediyor. Üstelik açık kaynaklı bir modelleri var. Buna karşılık, OpenAI o3-mini’yi ücretsiz olarak sunarak savunma önlemleri aldı bile. Bunun maliyet açısından etkili mi yoksa zararına mı olduğu belirsizliğini koruyor. Bir rakip sizin bilmemkaç yılda yaptığınızı dört ay içinde daha ucuza kopyalayabiliyorsa, durumunuz sarsıntılıdır.
Microsoft ve AWS
Her iki şirket de nispeten modelden bağımsız ve öncelikli olarak bilgi işlem altyapısı sağlamaya odaklanıyorlar. Microsoft’un durumunda, bu kurumsal uygulamaları da içeriyor. Muhtemelen R-1’i memnuniyetle karşılayabilir. Çünkü daha ucuz, daha verimli modeller daha hızlı ve daha geniş kurumsal benimsemeyi teşvik edebilir. Satya Nadella daha önce Jevons paradoksuna atıfta bulundu. Yani bir şey daha ucuz veya daha verimli hale geldiğinde, kullanım azalmak yerine genişler. Microsoft yakın zamanda müşterilerin aracı iş akışları oluşturmasına olanak tanıyan CoPilot Studio’yu duyurdu. Bunlar token’ları tüketiyor, bu nedenle daha ucuz modellere erişim sağlamak ürünü daha da çekici hale getiriyor.
Meta
Meta açıkça endişeli. Önde gelen bir açık kaynak model sağlayıcısından DeepSeek’in R-1’inin gerisinde kalmaya geçti. The Information’a göre :
Yapay zeka altyapı direktörü Mathew Oldham da dahil olmak üzere liderler, çok sayıda meslektaşına, Meta’nın amiral gemisi yapay zekası Llama’nın bir sonraki versiyonunun, Çinli yapay zeka DeepSeek kadar iyi performans göstermeyeceğinden endişe duyduklarını söyledi. Bu gelişme, Meta’nın yakalama çabaları hakkında doğrudan bilgisi olan iki çalışan tarafından aktarıldı.
Şirket, R-1’in bu kadar düşük maliyetle nasıl eğitildiğini analiz etmek için “savaş odaları” düzenledi ve Llama’yı DeepSeek’in yaklaşımını yansıtacak şekilde yeniden yapılandırabilir.
Etkileyici hızına, geniş bağlam penceresine ve rekabetçi fiyatlandırmasına rağmen, Google’ın Gemini Flash Experimental 2 akıl yürütme modeli teknoloji topluluğundan şaşırtıcı derecede az ilgi gördü. Büyük bağlam penceresi gerçek bir kazanan. İçine bir milyon token (birkaç kitap) atabilirsiniz ve size 65.000 token’a kadar geri dönüş yapabilir. Harika bir ürün. Ancak, Google’ın optimizasyonlarında Deepseek kadar becerikli olmadığını varsayabiliriz.
Apple
Apple için bu iyi bir haber olabilir. Şirket yapay zeka araştırmalarında geride kalıyor. En ilginç modelleri kenarlarda ince ayar yapılmış – örneğin, en büyük modeli yalnızca 30 milyar parametre olan MM1 model ailesini oluşturdular. Dahili çabaları cihaz üstü yapay zekaya odaklanırken, veri merkezi yatırımları diğerlerinin gerisinde kalıyor. Yerel olarak ince ayar yapılabilen ve iyileştirilebilen açık kaynaklı bir model Apple’a beklenmedik bir avantaj sağlayabilir. Apple hissesini yaklaşık yüzde 3 yukarı çeken piyasalar bunu fark etmiş gibi görünüyor.
Nvidia
İlk bakışta, Nvidia’nın endişe için en ciddi nedeni olabilir. DeepSeek’in çok daha az işlemle yüksek performans göstermesi, Nvidia’nın temel büyüme itici gücü olan büyük ölçekli GPU satışlarını baltalıyor. Daha geniş endüstri, normal maliyetin çok daha az bir kısmına en iyi performans gösteren yapay zeka modellerini çalıştırabileceğini fark ederse ve bu yöntemler açık kaynaklı ve kolayca çoğaltılabilirse, pahalı H100’lere olan talep önemli ölçüde düşebilir. Nvidia’nın 20x’lik ileri satış çarpanı ve yüzde 75 brüt marjları, onu GPU siparişlerindeki herhangi bir büyük değişime karşı özellikle savunmasız hale getiriyor. Nvidia’nın yüzde 75’lik brüt kar marjı AMD, Cerebras ve Groq için büyük bir fırsat. Ancak evdeki pazar çarşıya uymayabilir. Intel’in eski patronu Pat Gelsinger’ın belirttiği gibi:
Bilgisayar, gaz yasasına uyar. Bu, kaynaklar (sermaye, güç, termal bütçeler vb.) tarafından tanımlanan kullanılabilir alanı doldurduğu anlamına gelir. CMOS, PC’ler, çok çekirdekli, sanallaştırma, mobil ve diğer birçok şeyde gördüğümüz gibi; bilgisayar kaynaklarını radikal olarak daha düşük fiyat noktalarında yaygın olarak kullanılabilir hale getirmek, pazarın daralmasını değil, patlayıcı bir şekilde genişlemesini sağlayacaktır. AI, bundan sonra her şeyde olacak ve bugün, bu potansiyeli gerçekleştirmek çok pahalı.
NOT: Bu yazı ilk olarak Turk Internet sitesinde yayınlanmış, izin ile YetkinReport’a alınmıştır. (Mehmet Taşnikli, yetkinreport)
NOT: Alıntı makaleler Hürseda Haber'in yayın politikasını yansıtmayabilir.