SavunmaTR
  • Savunma Sanayii
    • Hava Platformları
    • Kara Platformları
    • Deniz Platformları
    • Silah Sistemleri
    • İnsansız Sistemler
    • Radar ve Elektronik Harp Sistemleri
    • Hava Savunma Sistemleri
  • Araştırma-Analiz
  • Gündem
  • İnfografik
  • Siber Güvenlik
  • Teknoloji
  • Yapay Zeka
  • SavunmaTR+
Sonuç Bulunamadı
Tüm Sonuçlar
  • Giriş
SavunmaTR
  • Savunma Sanayii
    • Hava Platformları
    • Kara Platformları
    • Deniz Platformları
    • Silah Sistemleri
    • İnsansız Sistemler
    • Radar ve Elektronik Harp Sistemleri
    • Hava Savunma Sistemleri
  • Araştırma-Analiz
  • Gündem
  • İnfografik
  • Siber Güvenlik
  • Teknoloji
  • Yapay Zeka
  • SavunmaTR+
Sonuç Bulunamadı
Tüm Sonuçlar
SavunmaTR
Anasayfa Yapay Zeka

OpenAI’nın GPT-4o modeli Çin kaynaklı içerikleri yüzünden gündemde

OpenAI'nın ses, metin ve video ile etkileşim kurulabilen GPT-4o modeli, Çin kaynaklı içerik sorunları ve etik ihlaller ile gündeme geldi.

Faruk Bera Zülaloğlu yazan Faruk Bera Zülaloğlu
27/05/2024
Okuma Süresi: 3 dakika okuma
A A
0

OpenAI’ın GPT-4o modeli büyük skandallarla çalkalanıyor!

Geçtiğimiz hafta OpenAI, ses, metin ve video ile etkileşim kurulabilen yeni yapay zeka modeli GPT-4o’yu tanıttı. Ancak, modelin piyasaya sürülmesinden sadece birkaç gün sonra şirket kendini büyük bir krizin içinde buldu. Güvenlik ekibinin büyük bir kısmının istifası ve Scarlett Johansson’un izinsiz olarak sesinin modelde kullanıldığı iddiası, OpenAI’ın imajını büyük ölçüde sarstı.

Yakın zamanlarda OpenAI’ın yeni GPT-4o modelinin eğitimi için kullanılan veri kümesinde ciddi sorunlar ortaya çıktı. Modelin metinleri parçalayarak modele hazır hale getiren veritabanında, Çin’deki spam web sitelerinden gelen veriler nedeniyle müstehcen ve kumar içerikli ifadeler yoğun olarak bulunuyor. Bu durum, modelin çıktılarında önemli hatalar ve yanlış yönlendirmeler yapma potansiyelini artırıyor. Uzmanlar, bu tür kirli verilerin modelin güvenilirliğini zedeleyebileceğini ve yanlış kullanım riskini artırabileceğini belirtiyorlar. OpenAI, modelin eğitimi sırasında yeterli veri temizliği yapmamış gibi görünüyor. Bu durum modelin performansını ve güvenilirliğini olumsuz etkiliyor. Çinli kullanıcılar ve araştırmacılar, bu durumun Çin dilindeki metin verilerinin kalitesi hakkında olumsuz bir algı yaratabileceğinden endişe ediyorlar.

Buy JNews Buy JNews Buy JNews
REKLAM

Çeşitli araştırmacılar ve yapay zeka uzmanları, GPT-4o’nun Çin dilindeki en uzun 100 ifadesinin 90’ından fazlasının spam sitelerden geldiğini belirledi. Bu ifadeler arasında “Pekin yarış arabası bahisleri” ve “Çin refah piyangosu” gibi cümleler yer alıyor. Carnegie Mellon Üniversitesi’nde bilgisayar bilimi doktorası öğrencisi Zhengyang Geng, durumu “Çinli biri olarak utanç verici” olarak nitelendirdi ve bu problemin veri temizliğinin yetersizliğinden kaynaklandığını söyledi.

Hong Kong merkezli araştırmacı Henry Luo, GPT-4o’nun çeşitli dillerdeki en uzun ifadelerini sorguladı ve farklı dillerde farklı temaların öne çıktığını belirledi. Rusça ifadeler hükümet ve kamu kurumlarıyla ilgiliyken, Japonca ifadeler teşekkür etmenin çeşitli yollarını içeriyor. Ancak, bu ifadeler arasındaki farklar, daha çok çevrimiçi olarak mevcut olan eğitim verilerinin türünü ve OpenAI’ın bu verileri toplamak için taradığı web sitelerini yansıtıyor.

OpenAI, model eğitiminde kullandığı veriler hakkında her zaman ketumluğunu koruyarak verilerin ne kadarının devlet medyasından ne kadarının spam içeriklerden geldiğini açıklamaktan kaçınıyor. Ancak, Çin’de yapay zeka sektöründe çalışan uzmanlar, kaliteli Çin metin veri setlerinin eksikliğine dikkat çekiyor. Büyük şirketler, sahip oldukları sosyal platformlardaki verileri rakiplerle veya üçüncü taraflarla paylaşmadıkları için, bu veriler genellikle dil modelleri açısından erişilemez kalıyorlar.

Kaliforniya Üniversitesi, San Diego’da siyaset bilimi profesörü Victor Shih, bu durumu şu şekilde yorumladı: “Çin devlet medyasının içeriğini kullanmamaya çalıştığınızda, işte elinize geçen bu oluyor.” Bu yorum, Çin dilinde büyük dil modelleri eğitmenin sorunlarını vurguluyor. Çin’e özgü temel problemler, çevrimiçi olarak kolayca erişilebilen verilerin ya “resmi” onaylanmış bir dil kullanımı ya da gerçek konuşmaları bastıran spam içeriklerden oluşmasından kaynaklandığı söyleniyor.

Bu problemler konuşulurken, OpenAI’ın bu konuda yalnız olmadığı belirtilmelidir. Diğer büyük şirketler de Büyük Dil Modelleri (LLM) oluşturma aşamalarında benzer sorunlar yaşamaktadır. Kaliteli Çin dili verileri olmadan, yapay zeka şirketlerinin kendi veri setlerini oluşturup uygunsuz ve önyargılı içerikleri filtrelemesi gerekmektedir. Ancak OpenAI, Çin’deki kullanıcılar modelini kullanamasa bile, dışarıdaki kullanıcılar için kaliteli hizmet sağlama sorumluluğunu taşımaktadır.

Etiketler: çin veri setiEtikGPT-4oOpenAIscarlett johanssonSpamtokenize ediciveri temizliğiyapay zeka

Benzer Haberler

Yapay Zeka

OpenAI’dan 500 milyar dolarlık yeni proje: Stargate

yazan Soner Eruçar
4 ay önce
0

OpenAI, yapay zeka alanında yeni hamleler ve projeler gerçekleştirmeye devam ediyor! Firma, yapay zeka altyapısının güçlendirilmesi ve ABD'nin yapay zeka...

Gündem

Las Vegas’ta Yapay Zeka Destekli Saldırı

yazan Faruk Bera Zülaloğlu
4 ay önce
0

Las Vegas’ta Trump International Hotel’in önünde gerçekleşen saldırıda, şüpheli Matthew Alan Livelsberger’in ChatGPT’yi patlama planı için kullandığı ortaya çıktı. Yetkililerin...

Nvidia RTX 50 Serisi: Yapay Zeka ve Oyun Teknolojilerinde Yeni Bir Çağ Başlıyor

4 ay önce

Nvidia CEO’su Yeni Nesil Oyun Çiplerini Tanıttı

4 ay önce

Cursor AI Nedir? Cursor AI Nasıl Kullanılır?

4 ay önce

Rus uçak motorlarının üretimine Çin’den yapay zekâ desteği

4 ay önce
Devamı Yükle

“Etkin, Güvenilir, Haberdar”

+90 530 308 17 96

[email protected]

2025 © Savunma TR. Tüm Hakları Saklıdır.

Savunma Sanayii
  • Hava Platformları
  • Kara Platformları
  • Deniz Platformları
  • İnsansız Sistemler
  • Silah Sistemleri
  • Radar ve Elektronik Harp Sistemleri
  • Hava Savunma Sistemleri
  • Hava Platformları
  • Kara Platformları
  • Deniz Platformları
  • İnsansız Sistemler
  • Silah Sistemleri
  • Radar ve Elektronik Harp Sistemleri
  • Hava Savunma Sistemleri
Kategoriler
  • Siber Güvenlik
  • Teknoloji
  • Röportajlar
  • Politika
  • Dosya Haber
  • Rapor & İnfografik
  • SavunmaTR Plus
  • Siber Güvenlik
  • Teknoloji
  • Röportajlar
  • Politika
  • Dosya Haber
  • Rapor & İnfografik
  • SavunmaTR Plus
SavunmaTR
  • Hakkımızda
  • Kariyer
  • Gizlilik Politikası
  • Künye
  • İletişim
  • Hakkımızda
  • Kariyer
  • Gizlilik Politikası
  • Künye
  • İletişim

Hoşgeldiniz

Aşağıdaki hesabınıza giriş yapın

Şifremi Unuttum?

Şifrenizi Sıfırlayın

Şifrenizi sıfırlamak için lütfen kullanıcı adınızı veya e-posta adresinizi giriniz.

Giriş
SavunmaTR
Onayı Yönet
En iyi deneyimleri sunmak için, cihaz bilgilerini saklamak ve/veya bunlara erişmek amacıyla çerezler gibi teknolojiler kullanıyoruz. Bu teknolojilere izin vermek, bu sitedeki tarama davranışı veya benzersiz kimlikler gibi verileri işlememize izin verecektir. Onay vermemek veya onayı geri çekmek, belirli özellikleri ve işlevleri olumsuz etkileyebilir.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, abone veya kullanıcı tarafından açıkça talep edilen belirli bir hizmetin kullanılmasını sağlamak veya bir elektronik iletişim ağı üzerinden bir iletişimin iletimini gerçekleştirmek amacıyla meşru bir amaç için kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından talep edilmeyen tercihlerin saklanmasının meşru amacı için gereklidir.
İstatistik
Sadece istatistiksel amaçlar için kullanılan teknik depolama veya erişim. Sadece anonim istatistiksel amaçlar için kullanılan teknik depolama veya erişim. Mahkeme celbi, İnternet Hizmet Sağlayıcınızın gönüllü uyumu veya üçüncü bir taraftan ek kayıtlar olmadan, yalnızca bu amaçla saklanan veya alınan bilgiler genellikle kimliğinizi belirlemek için kullanılamaz.
Pazarlama
Teknik depolama veya erişim, reklam göndermek için kullanıcı profilleri oluşturmak veya benzer pazarlama amaçları için kullanıcıyı bir web sitesinde veya birkaç web sitesinde izlemek için gereklidir.
Seçenekleri yönet Hizmetleri yönetin {vendor_count} satıcılarını yönetin Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri görüntüle
{title} {title} {title}
Sonuç Bulunamadı
Tüm Sonuçlar
  • Savunma Sanayii
    • Hava Platformları
    • Kara Platformları
    • Deniz Platformları
    • Silah Sistemleri
    • İnsansız Sistemler
    • Radar ve Elektronik Harp Sistemleri
    • Hava Savunma Sistemleri
  • Araştırma-Analiz
  • Gündem
  • İnfografik
  • Siber Güvenlik
  • Teknoloji
  • Yapay Zeka
  • SavunmaTR+