Şimdi Ara

Yeni AMD işlemci bilgisi sızdı.

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
41
Cevap
1
Favori
3.221
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
9 oy
Öne Çıkar
Sayfa: 123
Sayfaya Git
Git
sonraki
Giriş
Mesaj
  • AMD'nin ilerde çıkarmayı düşündüğü Zen çekirdek Greenland Stream Processor ile ilgili bazı bilgiler sızdı. Kaynak Fudzilla.

     Yeni AMD işlemci bilgisi sızdı.

    Grafikten görüleceği üzere 16 zen çekirdeği, 8 MB L2 cache, devasa 32 MB L3 cache söz konusu.
    İşlemci bu hali ile ben masaüstüne fazlayım, benden iyi iş istasyonu olur diyor gibi.

    Diğer ilgi çekici husus 4 kanal max 1TB DDR4 bellek desteği. Şu an genelde 64 GB sınırlarında gezdiğimiz (FX=32 GB, APU=64 GB) düşünülürse bu devasa bir değer. Halihazırda AMD 2 kanal bellek kullanıyordu ve özellikle güçlü APU tipleri için ciddi darboğaz yaratıp GPU'yu frenliyordu. Hızlı bellek takınca çok bariz ortaya çıkıyordu bu durum. Hatta FX-8 serisi için bile normal-oyun için pek önemli olmasa da, render-cam-encode vb işlerde 1866-2133-2400 hız farkı önemli oluyor %15-20 civarı fark yapabiliyordu.

    Zen çekirdeklerinin mevcut FX (piledriver) çekirdeklerinden 2 kat filan hızlı olması da beklendiğinden 2 kanal belleğin 16 çekirdeği (32 thread) besleyemeyeceği açık. AMD zaten Opteron serisinde 4 kanal kullanıyordu ki yerinde olur bu durum. Ancak 1 TB max bellek kapasitesi çok acaip bir durum. 4 slotla 256 GB, 8 slotla 128 GB bellek modülü demek bu. DDR3 için ibel genelde 1-2-4-8 GB modüller yaygın. DDR4 bile 8 ile başladı sayılır ve 16 GB modüller yeni görünüyor.

    Yaklaşık 6-7 yıldır DDR3 desteği veriyor AMD. Buna bakarak DDR3 modüllerin 1-2-4-8 GB boyutlarına göre DDR4 için 16-32-64-128-256 olarak yeni işlemcisinin de uzun süre DDR4 bellek destekleyeceğine, yani aynı bellek kontrolcüsünü uzun yıllar kullanmayı düşündüğüne inanabiliriz. Kısaca DDR3 için AM2+, AM3, AM3+ (FM de var) gibi anakart-soket uyumunun uzun süreli olacağına ve güncellemede cebimizden az para çıkacağını kabul edebiliriz. yalnız 1 TB ram desteği yine ben masaüstü değil iş iştasyonu içinim diye el sallıyor açıkça.

    Ancak esas ilgi çekici husus grafik. 512 GBs bantgenişliği veren dahili 16 GB HBM bellekten bahsediliyor.
    Yahu harici R9-390X için bile 640 GBs veren 8 GB HBM bellek söz konusu. Bunlar işlemci içine nasıl acaip bir GPU koyacaklar ki bu kadar bantgenişliğine ihtiyaç duyuyor.
    Halen 7850K içindeki bile 28 GBs kullanıyor. Bunun iki katı güçlü olacağı söylenen carrizo bile tüy siklet kalır yyanında. Dahili GPU olarak R9-390 ayarı GPU mu olacak diye düşünüyor insan. Böyle bir GPU olursa kim harici kart alır orası ayrı bir muamma.

    Yine 16 GB gibi devasa bellek işlemci die üzerine nasıl sığdırılacak. Grafikte harici değil işlemci üzerinde diye görünüyor. DRAM olsa bile 32 milyar parça demek sadece veri hücreleri. (1 dram hücresi 1 transistör+1 kapasitör, sram hücresi 8 transistör+4 direnç) Birde bunun adres çözme mantığı var. 40 milyar parça desek şimdiki işlemciler bile 2-2,5 milyar taransistörden ibaret. Devasa 32 MB L3 + 32 çekirdek ile birlikte 50 milyar parça içeren CPU nasıl olacak ?

    İnsanın aklına eski Pentium II veya K7 Athlon gibi slota takılan kartuş tipli işlemciler geliyor. Bu 16 GB vram acaba bunlardaki cache gibi işlemcinin yanlarında bulunan entegreler içinde mi olacak ? En mantıklısı bu gibi görünüyor gözüme.

    64 adet PCIe yolu da ilginç. halen 970 serisinde 28, 990 serisinde 48 tane var. Mesela bende 970 çipli anakart var. 16 yol PCIe x16 için. 4 tane de ikinci kanal için etti 20.
    1 tane alt sistem yolu için (PCI, ses, RTC, SMbus vb vb), 1 tane AHCI (usb 1.1-2.0), 1 tane OHCI (usb 3), 1 tane 6 sata, 1 tane VIA esata+firewire için. Toplam 24 etti. kalan 4 tane de 2 tane PCIE 1x-4x yolları için.

    Burada 64 tane nasıl dağıtılacak. İlgi çeken sata+esata için 16 tane kullanılmış olması. Yani şu anki gibi tüm sata kanalları ortak hat değil. Hepsine ayrı ayrı gibi. 16 tane sata bağlantısı mı olacak ? (iş istasyonu ??? ) Veya sata3 darboğazından kurtulmak için (PCIE takılan sata birimi gibi) mi kullanılacak acaba ? hadi böyle olsun alt sistem, ahci, ohci, xxx için 4 tane gitti etti 20 kaldı 44 tane. Haydi 2x16x PCIe olsa yine artıyor 12 tane. e yapılacak acaba.

    Birde 512 GBs ve 16 GB vram kullanacak dahili GPU olursa kim harici iki kartla CFX yapar ki ? yine mi iş istasyonu (render vb) amaçlanıyor ?

    Çok acaip veriler. Bakalım ne çıkacak.



    < Bu mesaj bu kişi tarafından değiştirildi melikulupinar -- 13 Nisan 2015; 12:20:52 >







  • 8375 mi geliyor dedim ama amd şaşırttı beni

    Testleri görelim hele sonra anlarız durumu



    < Bu mesaj bu kişi tarafından değiştirildi donanımcı123 -- 10 Nisan 2015; 15:03:48 >
  • Amd reklamlarda gürlüyor gürlüyor ama bir türlü yağamıyor.

    Umarım bundan sonrası için yine eski günlerine dönecek hamleler yaparlar (athlon 64 ve ilk fx`lerdeki gibi)
  • quote:

    Orijinalden alıntı: Humboldt

    Amd reklamlarda gürlüyor gürlüyor ama bir türlü yağamıyor.

    Umarım bundan sonrası için yine eski günlerine dönecek hamleler yaparlar (athlon 64 ve ilk fx`lerdeki gibi)


    AMD için tasarım sorunu yok da.

    Üretim işini bir türlü çözemedi yıllardır.

    Belki şu samsung-GLofo ortaklığı ile (14-16 nm finfet) bu işi hallederler.
  • Çıkmasına daha çok var daha ne dedikodular gelir. Amd zaten kağıt üstünde her zaman güzel ama möhüm olan icraat. Senelerdir herkes amd'den sıçrama bekliyor ama intelin mevcut olan 5960x cpu'sunu yakalarsa 2016'da onu bile büyük bir mucize olarak görebiliriz fakat kimsenin artık amd'den böyle şeyler beklemediğide ortada.
  • ilk çıkan pentium 2 lerde vardı kısa samsun paketi kadardı, slota takılıyor idü.
    bu arada milleti bilmem ama bence bu ddr4 işi iyi oldu.
    abi bak bunun içinde 4 stick var. 4'lü paketler quad oluyo diye bana dual channel dörtlü kit uzatan satıcılardan birine rastlamak ne kadar kolaysa, quad kit bulmak o kadar zor. millet çatır çatır x79 aldı, hangi biri aldığı rama dikkat etti?
    bu zımbırtılar çıkana kadar ddr4 olayı da iyicene bi oturur (en azından fiyat açısından)
  • intel gibi elle tutulur bilgi istiyoruz.bol kepceden sallamak kolay.

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • 16 çekirdeği nörüyüm ya , çekirdek az olsun öz olsun tabi vur dedim öldür demedim 2 dene de koy dimedim yanı

    6 yapsın 8 yapsın ama çekirdekler güçlü olsun yani önemli olan bu .
  • HSA AMD nin son yıllardaki en buyuk kozu kesinlikle rakip firmaların çekinmesi lazım çok güzel gelişmeler bunlar bravo AMD

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • quote:

    Orijinalden alıntı: rabitelli

    ilk çıkan pentium 2 lerde vardı kısa samsun paketi kadardı, slota takılıyor idü.
    bu arada milleti bilmem ama bence bu ddr4 işi iyi oldu.
    abi bak bunun içinde 4 stick var. 4'lü paketler quad oluyo diye bana dual channel dörtlü kit uzatan satıcılardan birine rastlamak ne kadar kolaysa, quad kit bulmak o kadar zor. millet çatır çatır x79 aldı, hangi biri aldığı rama dikkat etti?
    bu zımbırtılar çıkana kadar ddr4 olayı da iyicene bi oturur (en azından fiyat açısından)



    Samsun paketinden bayağı büküktü yahu. (epey uzundu az yüksekti)

    Bu 16 GB HBM anca böyle sığar. kartuşun iki tarafında işlemcinin iki yanına dörderden 16 tane çip gerek sanırım şu anki kapasiteyle.
    Bu bile ilk başta 4-8 filan olabilir, sonra artabilir.

    Yoksa 40-50 milyar parça içeren die çok zor görünüyor.
    Ayrıca o kadar küçük alanda watt olayı halledilmez. Soğutma sonuçta yüzey genişliği ile direkt ilgili bir olay.




  • Zen için 1 çekirdek 4 thread diyorlardı,burdada 2 izlekli görünüyo hangisi olacak acaba?
    Masaüstüne şöyle hbmli bi apu çıkarsada Amd ona geçsek,acaba 4 kanal ram olunca x99 soket gibi 8 ram slotumu olacak?
  • melikulupinar kullanıcısına yanıt

    valla aradan geçmiş 25 sene, tam boyunu hatırlamıyom

    bu anlatılanlar daha dedigodu. muhtemelen bu dedikodudaki yapıdan az daha taviz verilecektir (yav belli de olmaz ha)
    her neyse, o zamana kadar eldeki sistemler de eskir. sonra gelsin horoza sorulan tavuk ve yımırta sorusu.
    cevap basit, ben annamam aga hangisi işime gelirse onu alırım.
    o kadar sığ bakıyom yani


    edit ek:
    la bunnar xeon phi gibi bi nane çıkarmasınlar sonunda. haha :)



    < Bu mesaj bu kişi tarafından değiştirildi rabitelli -- 10 Nisan 2015; 20:09:03 >




  • 2 kanal bellek ile 4 kanal bellek arasındaki fark nedir acaba? Performansa nasıl etkisi olabiliyor

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • İş istasyonu için değilse eğer,bu amd'nin yine tek çekirdek performansını bırakıp fantazilerine devam ettiğini gösterir.

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • masa üstüne böyle bir işlemci gelmez. tdp problemi çıkar. üstelik o zar alanına bu kadar gücü nasıl sığdıracakları ayrı bir mesele.
  • Çok heyecan verici. Bulldozer gibi olmazsa harika olur. Bekliyoruz. 2018de sistem toplayacağım

    < Bu ileti mini sürüm kullanılarak atıldı >
  • CVenturas kullanıcısına yanıt
    xxxxxxxxxx



    < Bu mesaj bu kişi tarafından değiştirildi huhuq -- 9 Şubat 2023; 18:34:11 >
  • c/p

    Oyun için değil zaten, o yüzden perf'i yeterli olduğu sürece fiyatının direk bi önemi yok bence.

    CPU hakkında detayı vs. bilgi yok ama bi sürü detayı için full coherent faln diyor. Bu, ilave gecikme engelleyecez derken cache alanının yeterince verimli kullanılamamasına yol açacak mı?

    GPU'nun CPU ile olan bağlantı-erişim yapısı HSA ve yeterince uygun yazılım katmanları ile desteklenip kodlanabilecek mi acaba?

    HBM'ler direk işlemci zar'ı üstüne oturtulmuyor (on-die değil). Bi tür taşıyıcı kart üstünde üstünde (interposer) HBM ve APU paketi beraber oturtuluyor. APU-HBM arasındaki bağlantılar bu taşıyıcı kart üstünden yapılıyor (eski L2 cache'i CPU dışında olan Pentium II'lere benzer, ama aynı interposer üstünde oluyorlar). Her tür bellek erişimi yoğun veya gecikmeye hassas algoritma için iyi yaklaşım bunların hepsi.

    Önemli olan GPU kısmının esnek olması, programlanılabilirlik anlamında HSA/OpenCL 2.0/daha esnek farklı kütüphanelerin vs. olması. Bunun benzeri bi örnek şimdilik tam olarak olmadığından AMD'ye katkısı görece çok olabilir. Ne Intel'in altyapısı tam buna uyuyor, nede Nvidia'nın ki. Bu yüzden eğer çekirdek perf'leri yeterince iyi ise faydası olabilir.

    Çin ABD teknlojilerinin ithalini yasakladı. Özel olarak Intel ile alakalı bu. Intell ile beraber AMD de alınmayacak anlamına geliyor sanırım bu. Diğer tarftan bu APU'nun benzeri eşdeğeri olamayacağı için bu yasak belki esnetilebilir? Çekirdeklerin becerisini bilmeden, GPU ile etkileşimli olan işler için bu coherent yapıların verimi hakkında bişey bilmeden karalamak fazla olur. Ama Xeon Phi'de olmayan bi sürü olasılığa imkan verdiğinden, geçici de olsa ben alalım diyebleceğim tarzda ürün olabilir.

    ABD hükümeti de, Intel'in Çin'e Xeon + Xeon Phi satmasını da yasakladı. Bu yasak olayı eğer Nvidia'ya da sıçrarsa,yasak sırası AMD'ye gelmeden belki 1 şansı olabilir mi? Yoksa toptan Çin'e süperbilgisayar / HPC için her tür teknoloji satışına mı kısııtlama getirilir?

    Nvidia'nın Volta'sı için ABD'de anlaşmalar var. DOE (ABD - Department of Energy - enery bakanlığı) 'nin PetaFlops çalışmalarında IBM-Nvidia'ya 2 büyük ihale verildi. IBM Power 9 ve Nvidia Volta 'dan oluşacak bu yeni süperbilgisayarlar. Teslim sürecindeki aksaklıklardan dolayı 1,5 seneden fazla gecikmelerin olabileceğinden falan bahsediliyor(yani baya baya gecikebilir). 3. ihale de, ilk iki sistemden farklı olması şartı olduğundan Intel'e verildi.

    Nvidia'nın Pascal'ı da GPU + HBM-HMC benzeri 3d tarzı bellek , yani büyük bantgenişliği içerecek. Eğer AMD'nin bu APU'su, yeterince yüksek hesaplama performansı verebilirse, tek sokete takılıp CPU gibi soğutulacağından, en azından bazı server dizaynlarında ciddi yer bulabilir. Intel hala Xeon Phi'leri, CPU gibi soketli hale getiremedi(tam olarak imkan yok ve masrafı var diye). AMD'nin bu APU'su bu yüzden yeterince yüksek perf verebilirse hem Pascal hem Xeon'lara güzel bi nanik yapabilir.

    AMD bu APU'yu, yeni bi harici kart ile bi tür hibrid CF'ye benzer şekilde, hibrid HPC yapısı şeklinde de çalıştırabilirse (Zen APU + 390x 'in server versiyonu yani), işin görece daha önemli daha öncelikli kısmı APU'da ve görece daha az gecikmeye duyarlı kısmı harici kartta çalışacak şekilde ortak bi yapı da olabilirse, daha da ilginç bi HPC altyapısına izin verebilir(simülasyonda APU'ya farklı harici karta farklı görev verilmesi yani). Böylece bu APU + Nvidia kart kullanmayı tamamen anlamsız hale sokablir böyle bi yapı.

    HPC alanında öyle program mrogram yazılım faln direk olarka çok sökmez PC tarafında olduğu gibi. Adamlar oturup gerekli altyapının bi kısmını kendileri yazarlar. Ha ama Nvidia HPC-Süperbilgisayar işin içine dahil olduğunda bu destek bi yere kadar işe yarar. O da genel olarak daha verimli kodlamadan tut daha optimum erişim altyapısı nereye kurulur kısımları ile alakalı olur.

    HSA veya bununla alakasız CPU-GPU'nun coherent iletişimini(içerikleri hakkında fikir sahibi oldukları, birisinin diğerinin uğraştığı bilgiye uzun uzadıya dolaşmadan görece daha hızlı erişebildiği), verimli bi şekilde kullanabilmek için bazı kütüphane - kodlama altyapısı - framework tarzı şeylere ihtiyaç olmalı mutlaka. coherent yapıları veirmli kodlamak, çeşitli kodlama tuzaklarına handikaplarına düşmemeye çalışmak her zman kolay olmaz. O yüzden bu CPU-GPU erişimi için AMD'nin direk olarak bi sürü şey sunuması lazım. OpenCL 2.0'ın getirdiği bu unified adress olayını destekeleme hikayeleri faln var. O açıdan bakınca CL 2.0 aslında bu tarz APU'umsu yapılarda iyi sonuç vermeli gibi geliyor.

    Yukarda DOE'nin süperbilgisayar ihalelerinde IBM-Nvidia'ya verdiği zımbırtılardan bahsettim. İşte IBM'in OpenCompute olayı ile herkese gelin beraber geliştirelim dediği olayda, CAPI denilen bi yapı da görece açık olarak geliştriliyor. CAPI denen şey CPU'nun donanımsal olarak CPU dışı yapılarla coherent olabilmesi ve bunun için gerekli altyapıları tanımlıyor. Yani Nvidia'nın Tesla'sı ile IBM'in Power9'u, sanki aynı sokettelermiş gibi coherent yapıda olabiliyorlar. Bunun için PCI-e'nin standart yapısından daha farklı yaklaşım da gerekiyor. Nvidia'nın NVLink olayının bi kısmı da bununla alakalı. PCI-e'nin görece farklılaştırılmış hali ile farklı soket-slotta olan Power9 CPU ve harici Tesla kartı bu NVlink gibi bir bus üstünden iletişim kurabilecekler. Aynı paket içindeki çiplerin coherent olabilmeleri için çok hızlı iletişim,gecikmesi düşük özel bi bus yapısı gerekir. Kaveri'deki coherent bus mesela bantgenişliği anlamında yüksek değil(10GB/s) ama erişim gecimesi olarak çok çok düşük (yani çok hızlı, cycle'lar ile ifade edilecek kadar düşük bu gecikme) bi yapıya sahip. Bu sayede GPU ile çok düşük gecikmeli iletişim kurabiliyor. NvLink ile Nvidia aynı zmanda çok geniş bw'ye sahip olmasını amaçlıyor(80-100 GB/s gibi). Mesela 2 Tesla kart arasında PCI-e üstünden iletişim yerine SLI köprüsünün çok gelişmiş versiyonu gibi NVLink'i kullanmak istiyor. Amaç farklı Tesla kartlar arasında hem düşük gecikme hemde yüksek BW elde etmek. Mesela iki kart arsında 80-100 GB /s gibi transfer hızları hedefliyor. Bu DOE'nin süperbilgisayar olayındaki durumda, Power9 ile Tesla (volta) arasında da bu tarz bi coherent bus olması bekleniyor. CAPI yapısı hem Power9 CPU'sunda, hem de Tesla kartında olacak ve Nvlink gibi coherent yapıyla bağlanacak. Bunun, Pci-e'nin kodlama(program kodlama yazılım vs. anlamında değil, taşıyıcı katman olarak, PCI-e'nin 8/10b , 128/130b kodlaması gibi), fiziksel elektrik özellikeri vs. açısından farklı ve daha da gelişmiş olması gerekiyor. Bütün bunların sonucunda, yukarda bahsettiğim gibi, Nvlink'in de coherent + düşük gecikme + yüksek bw sunabilen olması amaçlanıyor. Hepsi birleşince Nvlink'in pek ucuza patlamayacağını düşünüyorum. Özellikle de fiziksel olarak birbirinden uzakta olan 2 farklı çip için (biri CPU soketi diğeri uzakta bi slota takılı kart).Yani birbiri arasında o kadar fiziksel mesafe olacak iki farklı mimarideki çipi hem coherent, hem çok düşük gecikme, hem de çok yüksek BW ile birbirine bağlamak kolay olacak iş değil. Ha tutup Infiniband'da 40GB/s BW'yi microsaniye gecikmeler ile Server-Server arasında iletişim için kullanabiliyoruz faln diyebilirsiniz. Nvidia bu Nvlink ve devamını zaten Server-Server arası için Infiniband/Ethernet/Fiber gibi iletişim yapılarının yerine de kullanmak istiyor. Zamanı gelince Mellanox vs.'ye de kazığı atacak yani. Diğer taraftan microsaniye gecikme, coherent yapı dediğin zaman nanosaniyelik gecikmelere göre yine çok yüksek demek.

    CPU-çekirdeğinden RAM'a ulaşmak mesela 150 cycle sürüyorsa (cache edilmemiş alan için), Coherent yapı dediğin zaman oluşacak gecikmenin de bu aralıklar civarında olması gerek(mesela 50-60 nanosaniye sürerken bu Ram'a erişim gecikmesi, coherent yapıda Power9 CPU'dan Tesla'ya erişimin de 1mikrosaniye altından gecikmesi gerek).

    Hepsini birleştirirsek, Nvidia, IBM CPU'ları ile coherent bus'a sahip özel bi bağlantı ile çalışacak yeni GPU peşinde (Volta). Bu, konumuz olan Zen APU'sundaki CPU-GPU coherent bus ile direk rekabet halinde diyebileceğimiz bi nokta. Yani AMD eğer gerçekten yüksek perf verebilirse, IBM-Nvidia'nın bu olaylarına karşı da sağlam bi taş koyabilir.

    Devam edersek, Intel'in HPC yazılım geliştirme araçlarına benzer AMD'Nin de bişeyler sunuması lazım. Intel Parallel Studio XE gibi hazırda ürünleri de var. Intel'in derleyicileri genelde AMD için de en iyi kodu üretiyorlar. O açıdan bakınca x86 uyumlu yapısı yüzünden hazırdaki bu tarz araçlardan da fayda görür AMD. Ama, AMD'nin GPU'su ve özellikle de APU tarzı yapıları için direk uygun çıktı veremez PArallel Studio gibi ürünler (Xeon Phi'yi hedef alabiliyor ama). Burda önemli nokta, AMD'nin bu tarz APU'umsu yapı için Parallel Studio'ya benzer, hem CPU hem GPU hem coherent hemde yeni yapıya uygun paket program gibi şeylerle de desteklemesi. Dediğim gibi kodlama-yazılım kısımlarıyla genelde adamlar kendileri ilgileniyor zaten. Gerektiğinde temiz destek de verilsin ve kütüphane vs. açısından yeterli destek olsun yeter (alakasız, ilk defa AMD çok kaliteli ve gelişmiş firmaya özel olan - vendor specific - bazı kodlama altyapılarını açık kaynak olarak herkesin kullanımına sunudu : Blas ve FFT kütüphaneleri. 2 seneye yakın oluyor ama bunların ekmeğini yiyenler var. Bi de öyle yüksek kaliteli Blas ve FFT kütüphanelerini elinizi kolunuzu sallaya sallaya bulamazsınız. Intel'in Nvidia'nın kendi kütüphaneleri sır gibi saklanır ).

    Doğal olarak bunları 28nm'de üretmezler. Daha önce yazdıklarımdan sağda solda karşılaşan var mı bilmiyorum ama, 7970 bugüne kadar üretilmiş en yüksek fiyat-perf'e sahip FP64 işleyeblen çipidir (Hawaii'ler faln dahil). O kadar ucuz fiyata o kadar yüksek FP64 kapasitesi hiçbiyerde bulamazsınız (ilk Nvidia Titan'ı bile geçecek kadar zorlar).

    Şimdi 7970'i %60 küçültürsek 140mm2'lere kadar inebiliriz belki. Çipin diğer yapısı hakkında hiçbi fikir öne süremeyecem ne kadar büyük olabilir vs. diye. Ama 7970 ayarında bi GPU'yu 20nm ve altında rahatça sığdırabilirler gibime geliyor.

    Bütün yeni mimari-yaklaşımlar sonucunda 20nm için 360-400mm2(7970+32MB SRAM+CPU dahil) bi APU ile gelebilirler belki. %45 üretim verimi olsa bile salt üretim maliyeti, olası satış fiyatları dikkate alındığında uygun gibi kalıyor 12 bin $ civarı wafer fiyatından hareketle. HBM elbet ilave maliyet.

    Geriye tek soru CPU performansı + CPU-GPU iletişim gecikmesi ve programlaması kalıyor. CPU performansı yeterince yüksek ise çok soketli yapılar ile çok ilginç sonuçlar veren mesela 4 Soket sistemlere bile izin verebilir. 4 Soket Intel sistemlerin çok pahalı olduğunu ve AMD'Nin 4S sistemlerde fiyat avantajı yüzünden hala kullanılabildiğini düşündüğümüzde, HBM+20nm ve altının, üretim verimi düşük büyük çip için getireceği toplam maliyeti yüksek olsa bile önemli avantajlara sahip olacağından tercih edilebilir.

    GPU olarak 7970'den daha da güçlü hesap özelliği olan bişeyin olması da beklenebilir. GPU gibi tex-rop üniteleri ile ve bunların erişim altyapıları ile dolu olması gerekmez. Bu da efektif olarak hızlandırıcı amaçla kullanılabilir GPU alanını arttırabilir.

    Yukardaki 7970 örneğinde, bugün 800 GFlop'a yakin fp64 matris çarpımı yapabiliyoruz. Bundan belli derecede daha güçlü bi GPU'umsu bi yapıyı çok daha küçük alan kaplayacak şekilde tasarlamak da mümkün. O zman alan olarak full 7970'den hareketle / veya perf olarak ondan belirgin oranda daha üstününü de düşünebilirz demek bu. Mesela 7970'den %40 daha fazla FP64 perf'i olan bi yapı kurabilirler. O da 1TFlop üstü FP64 demek zaten.

    Bütün bunlara olumsuz ilave, Intel'in yeni işlemcileri 512 bit AVX üniteleri ve uygun altyapı ile gelecek(veya öyle bekleniyor). Uygun şartlarda FMA ile 512bit AVX'i, 2.5 GHZ 12 çekirdek CPU'da 960 GFLOP FP64 kapasitesi olabilir. Bunun APU gibi bi yapı ile değil %100 CPU ile olduğunu unutmayalım (FMA ile double precision / FP64 için HAswell 16 işlem yapabiliyorken Skylake'in 32 işlem yapması bekleniyor). Sadece CPU ile 1 TFlop fp64 sınırına ulaşılabilmesi, üstelik farklı kodlama olmadan CPU'nun gecikme avantajları ile bakınca baya iyi değerler.

    Yani Intel'in yeni CPU'ları, en azından bazı açılardan baya baya bi sıkıştırabilir bu yeni HPC APU'ları. Elbette APU'ya HBM ve yüksek erişim ile bellek imkanı verirsen bi sürü olasılık ortaya koyuyorsun ve bazıları çok daha önemli ve yüksek perf'e yol açabilir(bellek erişimi yoğun, yüksek bw'ye bağımlı algo'nun tasarlanması vs. vs.). Yine de bazı açılardan Intel sırf CPU perf'i sıkıştırıyor olacak. Umarım iyi iş yapabilir AMD.

    Daha yazacaklarım var da, zaten uzun oldu.




  • Amd yapacak galiba bu sefer

    < Bu ileti mini sürüm kullanılarak atıldı >
  • işlemcisi ekran kartını kaldıracakmı yani şimdi?
  • 
Sayfa: 123
Sayfaya Git
Git
sonraki
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.