Meta’nın Güçlü Yapay Zekası: Llama 3 Nedir?

Teknoloji devleri birer birer meydana iniyor. Yapay zeka dünyasında her şey çok hızlı ilerlerken, dev şirketler de fark yaratmak için var gücüyle çalışıyor. ChatGPT-4o ile ciddi ilerlemeler kaydeden Open AI ve Gemini ile yeteneklerini bir adım öteye taşıyan Google, önde gelen örneklerden. Öte yandan, adı diğerleri gibi fazla gündeme gelmese de yapay zekaya ciddi yatırımlar yapan bir şirket daha var: Meta, Llama isimli büyük dil modelini (LLM) sürekli olarak geliştirmeye devam ediyor.

Llama, özellikle açık kaynaklı doğası ile oyunda giderek daha önemli bir oyuncu haline geliyor. Meta kısa süre önce Llama 3 AI modelini piyasaya sürerek büyük bir sıçrama yaptı. Yeni modelin kullanımı ücretsiz, geniş bir kullanıcı tabanına sahip ve açık kaynak kodlu. ChatGPT kadar adı anılmasa da Llama 3 gerçekten çok yetenekli. Aslında yapay zeka modellerini kıyaslamak için belirli kriterler yok, ancak bazı unsurları göz önüne alarak kıyaslamalar yapmaya çalışacağız. Bazı Llama 3 geliştiricileri, en son modelleri önde gelen alternatiflerden bazılarıyla karşılaştıran testler paylaşıyor ve çoğu durumda Llama 3 zirveye çıkıyor. Bu kıyaslamalar matematik, doğal dil işleme, kodlama yetenekleri ve genel bilgi ve anlama becerilerini kapsıyor.

Meta’nın Yapay Zekası: Llama 3 Nedir?

Llama 2’nin halefi olan Llama 3, muazzam metinler ve kod veri kümeleri üzerinde eğitilen, arkasında sosyal medya çatı şirketi Meta’nın olduğu bir yapay zeka modeli. Bu sayede dili kapsamlı bir şekilde anlayıp yanıt verebiliyor ve farklı türlerde yaratıcı içerik yazma, dil çevirisi yapma ve sorularınızı bilgilendirici bir şekilde yanıtlama gibi görevler için uygun hale geliyor.

Başka bir deyişle, Llama 3 de GPT-4 ve Google Gemini gibi bir LLM ailesi. Gelişmiş yeteneklere sahip olan LLM, temel sosyal medya platformlarına (Facebook, Instagram ve WhatsApp) yeni yapay zeka asistanı (Meta AI) olarak entegre ediliyor. Llama ve diğer LLM’ler arasında bazı teknik farklılıklar var, ancak bu konuyu tartışmak için yapay zeka konusunda çok derinlere inmemiz gerek. Şöyle özetleyebiliriz ki tüm bu LLM’ler temelde aynı şekilde geliştirildi ve benzer şekilde çalışıyor.

Meta’nın güçlü yapay zekası, bir istekte bulunduğunuzda insan beyninden sonra modellenen milyarlarca değişkene (parametreler) sahip basamaklı bir algoritma olan sinir ağını kullanarak takip eden metni en makul şekilde tahmin etmeye çalışıyor. Tüm farklı parametreler için farklı önem seviyeleri belirleyebiliyor. Ayrıca biraz da “rastgele” şekilde çalışarak inanılmaz şekilde insan benzeri yanıtlar üretme becerisine sahip.

Llama 3’ün geliştirilmesi, özellikle Meta için LLM teknolojisinde önemli bir kilometre taşını temsil ediyor. Açık kaynaklı olması işbirliği ve modelin geleceği açısından çok önemli. Yani Llama 3 gelecekte çok daha güçlü ve çok yönlü yapay zeka araçları sunabilir. Araştırma ve geliştirme ilerledikçe, Llama 3 için çeşitli sektörlerde daha da yenilikçi uygulamalar bekleyebiliriz.

LLama 3 Sürümleri ve Gelecek Yıllar

Meta, şu ana kadar Llama 3’ün dört versiyonunu yayınladı:

Llama 3 8B
Llama 3 8B-Instruct
Llama 3 70B
Llama 3 70B-Instruct

8B modelleri 8 milyar parametreye sahipken, iki 70B modeli 70 milyar parametreye sahip. Her iki talimat modeli de insan talimatlarını daha iyi takip edecek şekilde ince ayarlandı, bu nedenle sohbet robotu olarak kullanılmak üzere ham Llama modellerinden daha uygunlar.

Şirket ayrıca Llama 3’ün 400 milyar parametreli bir sürümü (ve muhtemelen 400 milyar parametreli bir talimat versiyonunu da) eğitiyor ve 2024 yılının sonlarında kullanıma sunmayı planlıyor. Bu çok büyük ve bir o kadar da karmaşık bir model olacak. Llama 3 modelleri yakında AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM, Snowflak, AMD, AWS, Dell, Intel, NVIDIA ve Qualcomm tarafından sunulan donanım platformlarının desteğiyle kullanıma sunulacak.

Çok Modlu Sürüm de Geliyor

OpenAI ve Google’ın en son modelleri gibi Meta da Llama 3’ün çok modlu bir versiyonunu geliştiriyor. Bu sayede görüntüler, el yazısıyla yazılmış metinler, video görüntüleri ve ses klipleri gibi farklı yöntemlerle çalışabilecek. Henüz bu seçenekler mevcut değil ancak önümüzdeki aylarda piyasaya sürülmesi bekleniyor. Diğer rakiplerle benzer şekilde, gelecekte çok sayıda dil de desteklenecek.

Nasıl Çalışıyor?

Llama 3, sinir ağını oluşturmak için 15 trilyondan fazla “token” ile eğitildi. Başka bir söylemle, toplam veri seti Llama 2’yi eğitmek için kullanılandan yedi kat daha büyüktü. Verilerin bir kısmı Common Crawl (milyarlarca web sayfasından oluşan bir arşiv), Wikipedia ve Project Gutenberg (dijital kütüphane) gibi halka açık kaynaklardan gelirken, bir kısmının da yapay zeka tarafından oluşturulduğu (hiçbiri Meta kullanıcı verisi değil) bildirildi.

Her bir token, modelin metne anlam katmasına ve takip eden metni makul bir şekilde tahmin etmesine olanak tanıyan bir kelime veya anlamsal bir parça. “Apple” ve “iPhone” kelimeleri sürekli olarak bir arada görünüyorsa, bu iki kavramın birbiriyle ilişkili olduğunu ve “elma”, “muz” ve “meyve “den farklı olduğunu anlayabiliyor. Meta’ya göre Llama 3’ün token üreticisi Llama 2’ninkinden daha geniş bir kelime dağarcığına sahip, bu nedenle önemli ölçüde daha güçlü.

Doğal olarak, bir yapay zeka modelini internet ortamında bulunan bilgilerle eğitmek ırkçılık gibi birçok olumsuz gelişmeye zemin hazırlıyor. Nitekim geliştiriciler, modeli güvenli ve faydalı yanıtlar verecek şekilde optimize etmek için insan geri bildirimiyle takviyeli öğrenme (RLHF) dahil olmak üzere farklı eğitim stratejileri de kullandılar. Test uzmanları, yapay zeka modelini daha uygun çıktılar üretmeye yönlendirmek için modelden gelen farklı yanıtları sıralıyor. Talimat versiyonları da insan talimatlarına doğal bir şekilde yanıt vermede daha iyi hale getirmek için belirli verilerle ince şekilde ayarlandı.

Meta ayrıca Llama 3’ün zararlı komutları çalıştırmasını veya güvensiz bilgisayar kodu üretmesini önlemek için tasarlanmış iki güvenlik modeli olan Llama Guard ve Llamma Code Shield’i de geliştirdi.

Tüm bu Llama modelleri, geliştiricilerin üzerine inşa edebilecekleri bir temel oluşturmayı amaçlamakta. Şirketinizin özel marka stilinde veya tarzında makale özetleri oluşturmak için bir LLM oluşturmak istiyorsanız, Llama 3’ü düzinelerce, yüzlerce, hatta binlerce örnekle eğitebilirsiniz. SSS (sıkça sorulan sorular) ve sohbet günlükleri gibi diğer ilgili bilgileri sağlayarak müşteri destek taleplerinize yanıt vermesi için talimat modellerinden birine daha fazla ince ayar yapabilirsiniz. Ya da Llama 3’ü alıp kendi tamamen bağımsız LLM’nizi oluşturmak için yeniden eğitebilirsiniz.

Meta AI Nasıl Kullanılır?

Facebook, Messenger, Instagram ve WhatsApp’ta yerleşik olarak bulunan yapay zeka asistanı Meta AI artık Llama 3 kullanıyor. Ayrıca tüm ülkelerden erişim sağlanamasa da yeni yayınlanan özel bir web uygulaması var. Meta’nın Meta AI’ı piyasaya sürdüğü sayılı ülkelerden birinde yaşamıyorsanız, AI deposu HuggingSpace’in örnek sohbet robotu HuggingChat‘i kullanarak 70B-Instruct modelinin demosuna erişim sağlayabilirsiniz.

Llama 3, bulut sağlayıcıları ve model API sağlayıcıları dahil olmak üzere tüm büyük platformlarda kullanılabilecek. Meta Llama modellerine doğrudan Meta’dan, Hugging Face veya Kaggle aracılığıyla erişebilirsiniz.

En Büyük Artı: Büyük Kullanıcı Kitlesi

OpenAI, ChatGPT’yi piyasaya sürdüğünde bu hizmete büyük bir ilgi vardı. Halen tüm dünya ChatGPT’yi konuşuyor konuşmasına, lakin bu sohbet robotu aniden çok hızlı şekilde büyüdü. GPT 3 ve GPT 4 modellerinin başarısının ardından on milyonlarca kullanıcı kazandılar. Meta’nın çözümünde işler biraz daha farklı ilerliyor.

Llama 3 aslında Facebook, Instagram, WhatsApp ve Messenger’ın yanı sıra tüm bu hizmetlerin web uygulaması sürümlerinde kullanılabilen Meta AI isimli asistanın içine gömülü olarak geliyor. Yani milyonlarca değil, milyarlarca kişi tarafından kullanılmakta; doğrudan olmasa bile. Sonuç olarak diyebiliriz ki Meta’nın elinde büyük bir kullanıcı kitlesi var. Gerek reklamlar gerekse bazı mesajlarla günlük kullanıcıların kullanımı teşvik edilebilir. Facebook, Instagram, WhatsApp ve Messenger’ın toplamda ne kadar çok kullanıcısı olduğunu biliyorsunuz. Bu konuda çok az şirket Meta ile rekabet edebilir.

Tamamen Ücretsiz

Meta CEO’su Mark Zuckerburg’ün başarısız Horizons VR girişimi bize bir şey gösterdi: Meta, ilerlemeyen projelere bile on milyarlarca dolar dökmekte hiçbir sakınca görmeyen bir şirket. Ancak böylesine ileri bir alana yatırım yapan bir şirketin para kazanmaya ihtiyaç duymaması çok çok önemli. Çünkü diğer yapay zeka geliştiricileri abonelikler veya başka şekillerde yatırımlarının karşılığını almak için çabalıyor. Meta’nın buna ihtiyacı yok.

Devasa veri merkezi altyapısı ve çeşitli hizmetlerinden elde ettiği sağlam temel gelir akışı sayesinde Meta, Llama 3’ü herkes için “ücretsiz” şekilde sunuyor. Sosyal medya şirketi, son sürümü ve gelecekteki LLM’leri daha da geliştirmek için milyarlarca dolar harcayabilir. Milyarlarca dolar harcama yapan şirketin bahsettiğimiz gibi milyarlarca kullanıcısı var. Sonuç olarak, milyarlarca kişinin hızlıca erişebileceği bir yapay zeka hizmeti doğuyor.

Bir Diğer Avantaj: Açık Kaynaklı

Kullanıcılar fiyata, geliştiriciler ise kodlamaya, şeffaflığa ve kolaylıklara bakar. ChatGPT ve çeşitli dil modelleri gibi tescilli platform yapay zekalarının aksine, Llama 3 açık kaynak kodlu bir çözüm. Böylelikle geliştiriciler kodların nasıl çalıştığını kontrol edebiliyor ve üzerinde değişiklikler yapabiliyor. Dahası, projeyi kendilerine göre uyarlayabilir ve yeni işler ortaya çıkarabilirler.

Nitekim açık kaynaklı olması bir avantaj. Bu sayede daha fazla sayıda geliştirici Llama 3 modeliyle ilgilenecek ve daha fazla projeye entegre edebilecek. Büyük kullanıcı kitlesinin yanı sıra, açık kaynaklı olması sayesinde Llama 3 gelecekte yapay dünyasında bir standart haline gelebilir.

Yerel Olarak Çalışabiliyor

Gemini, ChatGPT veya Llama gibi büyük LLM’lerin en büyük dezavantajı, eğitim aşaması ve gündelik kullanım için aşırı miktarda bilgi işlem gücü gerektirmeleri. Bu yüzden bazı özellikleri kullanabilmeniz için ödeme yapmanız gerekiyor. Aynı zamanda çok sayıda sorgu gerçekleştiğinde hizmet meşgul olabiliyor, yanıtlar gecikebiliyor.

İyi olan şu ki Llama 3, tüketicilerin elindeki dizüstü bilgisayarların donanımında yerel olarak çalışabiliyor. Etkili bir şekilde çalışması için çok belleğe ihtiyaç olsa da bu önemli bir artı.

Llama 3’ün yeni sürümlerinin geleceğini söylemiştik. Şu anda yanıtlarda 70 milyar parametre kullanılıyor, ancak Llama’nın 400 milyara kadar parametre kullanan dahili sürümleri var. Aslında yerel olarak çalıştırılabilen farklı LLM’ler vardı olmasına. Meta’nın AI modeli en büyük ve en başarılı olanı. Gelecekte akıllı telefonlarda, akıllı gözlüklerde ve farklı cihazlarda yapay zekayı daha ulaşılabilir hale getirebilir.

Sonuç

Llama 3 harika, ancak henüz yapamadığı çok şey var. Şu anda tamamen metin tabanlı, yani ChatGPT ve benzeri hizmetler gibi çok modlu değil. Video, ses ya da görüntü işleyemiyor. Sesli komutlara yanıt veremiyor ya da sizinle konuşamıyor. Şu anda yalnızca İngilizce dilinde çalışıyor.

OpenAI GPT 4, Google Gemini ve Anthropic Claude gibi adını duyduğunuz LLM’lerin çoğu tescilli ve kapalı kaynaklı. Araştırmacılar ve işletmeler erişim için resmi API’leri kullanabiliyor ve hatta modellerinin sürümlerini ince ayarlayarak özel yanıtlar sunabiliyor, ancak arka planda neler olup bittiği konusunda fikir sahibi değiller.

Diğer taraftan Llama 3 ile modeli hemen indirebilir, teknik becerilere sahip olduğunuz sürece bilgisayarınızda çalıştırabilir ve hatta kodunu inceleyebilirsiniz. Bu arada bir hatırlatma; küçük LLM’ler bile GB’larca alan kaplıyor. Meta ayrıca 400B modeli hazır olduğunda her üç modelin nasıl eğitildiğini detaylandıran tam bir araştırma makalesi yayınlamayı planlıyor.

Çok faydalı başka bir nokta: Hugging Face gibi platformlar aracılığıyla Microsoft Azure, Amazon Web Services ve diğer bulut altyapılarında da çalıştırabilir ve ihtiyacınız olan metin türünü oluşturmak için kendi verileriniz üzerinde eğitebilirsiniz.

Sürekli dile getiriyoruz, yapay zeka evreni gerçekten inanılmaz derecede hızlı büyüyor. Son 70 yılda bilgisayar alanındaki büyük gelişmelerin pek çoğu açık araştırma ve deneyler üzerine inşa edildi ve şimdi yapay zeka da bunlardan biri olacak gibi görünüyor. Llama’nın dünyaya açılması en çok da şu açıdan iyi oldu: Kapalı kaynaklı yapay zeka çözümlerine karşı her zaman büyük ve belki güvenilir diyebileceğimiz bir alternatif var.

Yazar Adı : Burak Temelkaya

Blog Listesi