قابل توجه کاربران گرامی: تاپیک معرفی اعضاء برای آشنایی بیشتر با یکدیگر (حتما شرکت کنید) لینک
صفحه 1 از 2 12 آخرینآخرین
نمایش نتایج: از 1 به 10 از 14
Like Tree9Likes

موضوع: تبادل نظر در مورد سری Volta (نامی قدیمی معماری نوین)

  1. #1
    Active Member
    asdaf آواتار ها
    تاریخ عضویت
    Oct 2013
    محل سکونت
    qom
    نام واقعی
    Mohammad.Ali
    نوشته ها
    225
    تشکر شده 1,661 بار در 231 پست
    asdaf آنلاین نیست.

    تبادل نظر در مورد سری Volta (نامی قدیمی معماری نوین)

    خرد هر کجا گنجی آرد پدید ز نام خدا سازد آن را کلید

    بعد از چند سال تاخیر بلاخره مشخصات و معماری ولتا ان چیزی که برای انویدیا برای رقابت راضی کننده بود نهایی شد

    در GTC 2017 اولین مسئله ای که توسط CEO انویدیا عنوان شد
    جهان پس از قانون مور

    روند افزایش ترانزیستور برای بالا بردن کارایی از دیدگاه افزایش بهینگی مصرف می اید

    در حقیقت کارایی cpu ها هر سال فقط 10 درصد افزایش پیدا می کنند اما gpu رشد قابل توجهی دارد
    به همین خاطر جریان کاهش بار cpu و دادن ان به gpu مخصوصا برای محاسبات سنگین اغاز شده است

    معرفی اولین تراشه سری ولتا با نام تسلا gv100
    طبق گفته انویدیا اندازه سطح این تراشه در نهایت پذیرش سطح لیتوگرافی ممکن است
    815 میلیمتر مربع !!!! و در لیتوگرافی 12 نانومتری مخصوص tsmc برای انوییدا FFN که برابر 21.1 بیلیون ترانزیستور می شود

    به دلیل افزایش مشکلات تراشه در سطوح بزرگ از تعداد 84 sm ان
    4 عدد برای غیر فعال بودن در نظر گرفته شده است و به صورت رسمی تعداد 80 SM اعلام شده

    نسبت به gp100 پاسکال در مصرف یکسان شاهد افزایش تعداد ترانزیستور و سطح تراشه 33 درصدی هستیم
    اما تعداد هسته های سایه زن 42 درصد افزایش داشته . که نشان از بهینه سازی معماری از نظر ترانزیستور دارد

    واحد کنترل حافظه HBM2 پهنای باند 1.2 برابری بیشتری از پاسکال دارد
    NVlink با سرعت بیشتر و حافظه coherency مشترک یکسان بین cpu و gpu
    شکل شاخص معماری انویدیا که متشکل از SM ها و GPC مشترک دارد تفاوتی نکرده
    و هر SM می تواند به صورت یک گرافیک مستقل عمل کند

    اما خود SM ها تغییراتی خیلی زیادی داشته است که ادامه مطلب فقط به ان اختصاص دارد

    [Only registered and activated users can see links. ]

    اولین چیزهایی که جلب توجه میکند تغییر تعداد قسمت های شدر و سایه زن هر sm به 64 عدد است
    که به چهار قسمت 16 تایی تقسیم شده است و دو بخش Tensor cores در هر کدام که تعداد کلی 8 در هر SM می شود

    در سابق انویدیا از simd هایی با طول 4 استفاده می کرده است
    و اگر همچنان این گونه باشد در هر بخش 16 قسمتی sm چهار simd یا چهار مرحله خط لوله با SFU هستند
    انویدیا گفته است که فرکانس را افزایش داده اند اما در gv100 و gp100 فرکانس با وجود sm های بیشتر ولتا تغریبا یکسان هست

    طبق گفته انویدیا sm های جدید 50 درصد بهینه تر هستند
    برخلاف سابق انویدیا بخش های عدد صحیح و شناور سایه زن های خود را از هم جدا کرده است
    که باعث شده است که INT و FP به صورت دستور غیر یکسان و همزمان فعالیت داشته باشند
    یا خاموش کردن بخش دیگر در صورت استفاده نشدن


    Independent Thread Scheduling

    علت یا عامل اصلی تغییرات معماری قابلیت دسته بندی رشته ها به صورت مستقل است
    برخلاف معماری مکسول که دسته بندی بر اساس کامپایلر داشت
    که این تغییر می تواند کمک زیادی در DX12 و Vulkan باشد

    در این تصویر تفاوت اصلی بین مکسول و ولتا را می بینید

    [Only registered and activated users can see links. ]

    در گذشته تمام نخ های یک warp از شمارنده برنامه pc یکسان استفاده می کردند
    ولی در ولتا هر نخ یک شمارنده مجزا و اختصاصی دارد

    [Only registered and activated users can see links. ]

    [Only registered and activated users can see links. ]

    که نتیجه باعث می شود که برخلاف مکسول که در sm به صورت همپوشی و قرار دادن اطلاعات
    یکسان در کل یک sm یکسان به صورت قفل شده بود
    در ولتا هرکدام می توانند به صورت دسته بندی دقیق تر و مشخص تر باشند


    مثالی از مدیریت شاخه یا branch و تفاوت انها در هر دو معماری

    [Only registered and activated users can see links. ]

    در مکسول دو شاخه که هر شاخه می تواند اطلاعات دیگری که به دسته ان می خورد داشته باشد
    تا صرفه جویی و مصرف بهینه از ضرفیت simd داشته باشد

    [Only registered and activated users can see links. ]

    اما در مدیریت مستقل نخ ها در ولتا هر شاخه به صورت مستقل هست
    که به ادرس دهی دقیق نخ ها در vulkan منجر می شود بر خلاف حالت قبل که کامپایلر بود

    اتحاد کش سطح اول و کش اشتراکی


    در گذشته و از زمان فرمی بعد از کش سطح دوم ، دو کش جداگانه وجود داشت
    که یکی کش اختصاصی سطح اول و دیگری کش اشتراکی که اطلاعات بین sm ها تبادل میکند

    [Only registered and activated users can see links. ]

    در مدل مکسول نبود کش سطح اول باعث کاهش سرعت 30 درصدی میشد
    اشتراک این دو قسمت به صورتی است که جداگانه نبودن کش سطح اول فقط 7 درصد کاهش سرعت دارد

    [Only registered and activated users can see links. ]

    در ولتا کش سطح اول می تواند coherency از طریق کش سطح دوم داشته باشد
    این قسمت یکی از ضروریت های api های چند نخی جدید هست
    که معماری gcn از همان ابتدا این گونه بوده است


    TENSOR CORES

    این قسمت پردازشی اضافه در sm ها پردازنده های تک منظوره ساده ای هستند
    که در عین توجه به صرفه جویی اندازه برای سرعت بخشیدن به محاسبات ماتریسی هوش مصنوعی هست
    Tensor با همین نام ابتدا توسط google برای هوش مصنوعی ابداء شد و به صورت متن باز و رایگان منتشر شد
    با استفاده از این پردازنده های ساده ضرفیت هوش مصنوعی انویدیا فقط در یک نسل به 12 برابر رسید
    چیزی که خیلی بیشتر از توانایی های cpu و gpu های عمومی هست
    وجود tensor و مرحله اضافه قبل از شدر ها تاخیر قابل قبول 7 میلی ثانیه می اورد

    [Only registered and activated users can see links. ]

    یکی از کاربرد های هوش مصنوعی در تکنیک نور پردازی ray tracing انویدیا هست
    Ray tracing یکی از پردازش هایی هست که سطوح اجسام و اندازه پیکسل ها و تفاوت خیلی زیاد انها فشار به گرافیک می اورد
    اما با گزینش هدفمند پیکسل ها با هوش مصنوعی بازدهی ray tracing خیلی افزایش پیدا می کند
    ویرایش توسط asdaf : 14th May 2017 در ساعت 12:25 AM


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  2. 7 کاربر بابت این ارسال مفید از asdaf تشکر کرده اند:

    amirsss (14th May 2017),ErfanDL (14th May 2017),golabettruter (14th May 2017),Olesius (24th August 2018),Optimus Prime (15th May 2017),Reza Y (15th May 2017),TERRORIST (14th May 2017)



  3. #2
    Active Member
    golabettruter آواتار ها
    تاریخ عضویت
    Mar 2013
    سن
    39
    نوشته ها
    348
    تشکر شده 1,245 بار در 299 پست
    golabettruter آنلاین نیست.
    درود محمدعلی جان بسیار عالی لذت میبرم از نقدهای موشکافانه شما
    فقط زمان رونمایی از معماری وگا هم اگه به همین صورت بررسیو بزارید بسیار ممنون میشویم
    باتشکر
    Optimus Prime likes this.


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  4. 2 کاربر بابت این ارسال مفید از golabettruter تشکر کرده اند:

    asdaf (14th May 2017),Optimus Prime (15th May 2017)



  5. #3
    Active Member
    asdaf آواتار ها
    تاریخ عضویت
    Oct 2013
    محل سکونت
    qom
    نام واقعی
    Mohammad.Ali
    نوشته ها
    225
    تشکر شده 1,661 بار در 231 پست
    asdaf آنلاین نیست.
    با سلام همون طور که گفته شده بود معماری مخصوص بازی انویدیا با معماری ولتا که برای سرور معرفی شده بود متفاوت هست
    معماری Turing در مقایسه با ولتا ترانزیستور کمتری دارد که ناشی از حذف بخش NV Link و یکپارچه بودن معماری دارد

    [Only registered and activated users can see links. ]

    سیستم جدید نور پردازی طبیعی همان گونه که ذکر شد با استفاده از محاسبات باعث می شود فقط پیکسل های لازم برای نور rasterization شوند به جای تمام صفحه در معماری سابق

    نسبت ترانزیستور و سطح تراشه معماری turing به پاسکال خیلی بیشتر از نسبت تغییر لیتوگرافی هست که نشان میدهد معماری افزایش ترانزیستور داشته

    در کنفرانس خبری به توضیح خود اقای هوانگ علت بهبود بازدهی در معماری جدید به خاطر انجام همزمان محاسبات int و fp به صورت مستقل هست
    که زمان کلی و بیکار بودن اجزا را کاهش میدهد

    [Only registered and activated users can see links. ]

    طبق این تصویر که گویا هست

    این نوع عملکرد خیلی مشابه فن اوری async از شرکت amd هست
    نباید انتظار معجزه در بازدهی را داشته باشید که کارشناسان دیگر هم با توجه به توضیحات هوانگ با من موافق هستند
    انویدیا مشکل async و بعضی قابلیت های جدید را حل کرده است
    این روش انویدیا در محاسبات تک منظوره و ناقص سرعت بیشتر و فرکانس بیشتر و بهینگی مصرف بیشتری دارد
    اما در تحت فشار همه منظوره گرافیک بحث فرق میکند

    اضافه کنم که ادعای انویدیا در 50 در صد سریع تر بودن معماری جدید در صورت استفاده شدن از گیم ورکس جدید هست
    در صورتی که از بازی ها و برنامه نویسی های قدیمی استفاده شود چندان فرقی نخواهد داشت
    گیم ورکس همیشه چاشنی طلایی انویدیا بوده

    انتظار می رود که Amd راه حل های خودش را برای قابلیت های جدید برای معماری خودش عملی کند
    همچنین از نظر راحتی برنامه نویسی تفاوت هایی وجود خواهد داشت
    ویرایش توسط asdaf : 23rd August 2018 در ساعت 07:18 PM
    msover likes this.


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  6. 5 کاربر بابت این ارسال مفید از asdaf تشکر کرده اند:

    amirsss (7th September 2018),golabettruter (27th August 2018),msover (27th August 2018),Olesius (24th August 2018),TERRORIST (23rd August 2018)



  7. #4
    Game Assistant
    VFSDF آواتار ها
    تاریخ عضویت
    Aug 2012
    محل سکونت
    تهران
    نام واقعی
    VahiD
    نوشته ها
    796
    تشکر شده 6,671 بار در 869 پست
    VFSDF آنلاین نیست.
    amd خیلی وقته توان رقابت با NVIDIA نداره شکست پذیرفته . بعیده تا چند سال اینده معماری جدیدی از ای ام دی شاهد باشیم

    NVIDIA داره با خودش رقابت میکنه رقیب جدی نداره.





    ویرایش توسط VFSDF : 1st October 2018 در ساعت 09:05 AM
    msover and asdaf like this.


    Motherboard : ROG STRIX Z690-A GAMING WIFI D4 Processor : Intel® Core™ i7 12700K
    Main Memory : G.SKILL TridentZ Gold Royal Series DDR4 32GB CL16 Graphics Card : NVIDIA GeForce GTX 1080 GALAX HOF 8GB GDDR5X
    Cooling : DEEPCOOL Castle 360 EX Power Supply : Corsair HX850i 80 Plus Platinum
    PC GAMER
    Always in Next Gen



  8. 3 کاربر بابت این ارسال مفید از VFSDF تشکر کرده اند:

    amirsss (7th October 2018),asdaf (1st October 2018),msover (2nd October 2018)



  9. #5
    Game Assistant
    VFSDF آواتار ها
    تاریخ عضویت
    Aug 2012
    محل سکونت
    تهران
    نام واقعی
    VahiD
    نوشته ها
    796
    تشکر شده 6,671 بار در 869 پست
    VFSDF آنلاین نیست.


    Motherboard : ROG STRIX Z690-A GAMING WIFI D4 Processor : Intel® Core™ i7 12700K
    Main Memory : G.SKILL TridentZ Gold Royal Series DDR4 32GB CL16 Graphics Card : NVIDIA GeForce GTX 1080 GALAX HOF 8GB GDDR5X
    Cooling : DEEPCOOL Castle 360 EX Power Supply : Corsair HX850i 80 Plus Platinum
    PC GAMER
    Always in Next Gen



  10. 2 کاربر بابت این ارسال مفید از VFSDF تشکر کرده اند:

    asdaf (8th October 2018),msover (12th October 2018)



  11. #6
    Game Assistant
    VFSDF آواتار ها
    تاریخ عضویت
    Aug 2012
    محل سکونت
    تهران
    نام واقعی
    VahiD
    نوشته ها
    796
    تشکر شده 6,671 بار در 869 پست
    VFSDF آنلاین نیست.
    انقلابی دیگر از انویدیا



    سکوت و شکست قاطع و بدون حرفو حدیث AMD


    Motherboard : ROG STRIX Z690-A GAMING WIFI D4 Processor : Intel® Core™ i7 12700K
    Main Memory : G.SKILL TridentZ Gold Royal Series DDR4 32GB CL16 Graphics Card : NVIDIA GeForce GTX 1080 GALAX HOF 8GB GDDR5X
    Cooling : DEEPCOOL Castle 360 EX Power Supply : Corsair HX850i 80 Plus Platinum
    PC GAMER
    Always in Next Gen



  12. کاربر زیر بابت این ارسال مفید از VFSDF تشکر کرده است:

    asdaf (19th October 2018)



  13. #7
    Active Member
    asdaf آواتار ها
    تاریخ عضویت
    Oct 2013
    محل سکونت
    qom
    نام واقعی
    Mohammad.Ali
    نوشته ها
    225
    تشکر شده 1,661 بار در 231 پست
    asdaf آنلاین نیست.
    با توجه به بررسی سایت هایی مثل اناند و بقیه
    [Only registered and activated users can see links. ]

    اینطور از مشخصات و قیمت گزاری عمدی انویدیا مشخص هست که
    rtx 2070 بازدهی نزدیک gtx 1080 و rtx 2080 نزدیک gtx 1080ti هست که تعداد هسته های نزدیک به هم را دارند
    rtx هسته هاش کمتره و بقیه ترانزیستور هاش صرف بهینه تر بودنش شده
    البته سری gtx قیمت کمتری از رقیب خودش از rtx دارد

    اگر ray tracing فعال بشود واقعا ارزش خودش را نشان خواهد داد
    حالا من نمی خوام که بهانه های کارهای نرم افزاری انویدیا رو بیارم . باید بگم که به انویدیا به خاطر نوع اوری و پیشرفت افکت های گرافیکی باید تبریک گفت


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  14. 2 کاربر بابت این ارسال مفید از asdaf تشکر کرده اند:

    peyman.wow2 (20th October 2018),TERRORIST (28th October 2018)



  15. #8
    Active Member
    golabettruter آواتار ها
    تاریخ عضویت
    Mar 2013
    سن
    39
    نوشته ها
    348
    تشکر شده 1,245 بار در 299 پست
    golabettruter آنلاین نیست.
    وباز هم از قابلیت ها و فناوریهای مسخره انویدیا که حالا گریبان کارتهای خودشم گرفته
    کارت 2080TI در بازی بتلفیلد v با فعال شدن DXR به زانو درمیاد
    اون از کارتهای معیوبی که تو پاچه ملت شد ، حالا هم غول کارت گرافیک های خودش جلوی فناوریهای به اصطلاح جدیدش زانو میزنه
    افت کارایی بالای 50 درصد اونم تو دقت تصویر 1080 پیکسل به زور بالای 60 فریم میرسه



    اخه یکی نیست بگه بابا فناوری که هنوز خودت توش ضعف داری چطور روش اینقدر مانور میدی

    تست های رسمی گرفته شدن برای هر سه کارت سری 20
    [Only registered and activated users can see links. ]
    [Only registered and activated users can see links. ]
    ویرایش توسط golabettruter : 14th November 2018 در ساعت 07:09 PM


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  16. 3 کاربر بابت این ارسال مفید از golabettruter تشکر کرده اند:

    asdaf (14th November 2018),msover (17th November 2018),TERRORIST (14th November 2018)



  17. #9
    Moderator
    TERRORIST آواتار ها
    تاریخ عضویت
    Sep 2012
    محل سکونت
    هر جایی که عملیات تروریستی باشه.
    نام واقعی
    Behzad
    نوشته ها
    2,023
    تشکر شده 14,918 بار در 2,102 پست
    TERRORIST آنلاین نیست.
    نقل قول نوشته اصلی توسط golabettruter نمایش پست ها
    وباز هم از قابلیت ها و فناوریهای مسخره انویدیا که حالا گریبان کارتهای خودشم گرفته
    کارت 2080TI در بازی بتلفیلد v با فعال شدن DXR به زانو درمیاد
    اون از کارتهای معیوبی که تو پاچه ملت شد ، حالا هم غول کارت گرافیک های خودش جلوی فناوریهای به اصطلاح جدیدش زانو میزنه
    افت کارایی بالای 50 درصد اونم تو دقت تصویر 1080 پیکسل به زور بالای 60 فریم میرسه



    اخه یکی نیست بگه بابا فناوری که هنوز خودت توش ضعف داری چطور روش اینقدر مانور میدی

    تست های رسمی گرفته شدن برای هر سه کارت سری 20
    [Only registered and activated users can see links. ]
    [Only registered and activated users can see links. ]
    درود

    همیشه صحبت هام درسته بوده و هستش حتی خوده NVIDIA هم قبول داره و می دونه الان بهترین زمان برای عرضه Ray Tracing نیستش چون شرکت مادر یعنی Microsoft اماده نیستش که بتونه کدهای بهینه در اختیار NVIDIA قرار بده.

    این طوری بگم اگر Microsoft نباشه NVIDIA هم نیستش و نمی تونه Ray Tracing اجراء کنه.

    مایکرو اومده بخش جدیدی به DX12 اضافه کرده که بتونه کدهای Ray اجرا کنه البته هنوز به بلوغ نرسیده و کار بسیار زیاد داره به خاطر همین هستش این مشکلات ما شاهدش هستیم.
    msover likes this.


    Motherboard : Asus X99-Deluxe-USB 3.1 Processor : Intel Core i7 6900K
    Main Memory : Gskill 4*8 Freq: 3200 MHZ 32 GB Graphics Card : Gigabyte GTX 1080 G1
    Cooling : Cooler Master MasterAir Maker 8 Power Supply : Cooler Master V-850 Full Modular



  18. 3 کاربر بابت این ارسال مفید از TERRORIST تشکر کرده اند:

    amirsss (16th November 2018),asdaf (14th November 2018),golabettruter (15th November 2018)



  19. #10
    Game Assistant
    VFSDF آواتار ها
    تاریخ عضویت
    Aug 2012
    محل سکونت
    تهران
    نام واقعی
    VahiD
    نوشته ها
    796
    تشکر شده 6,671 بار در 869 پست
    VFSDF آنلاین نیست.
    AMD BYE BYE

    و اینک پایان کار شرکت منفور amd و سکوت معنی دار اندک طرفداران باقی مانده این شرکت عقب مانده.
    amd زانو زد و تسلیم و مبهوت قدرت بی انتهای nvidia کبیر شد.



    Motherboard : ROG STRIX Z690-A GAMING WIFI D4 Processor : Intel® Core™ i7 12700K
    Main Memory : G.SKILL TridentZ Gold Royal Series DDR4 32GB CL16 Graphics Card : NVIDIA GeForce GTX 1080 GALAX HOF 8GB GDDR5X
    Cooling : DEEPCOOL Castle 360 EX Power Supply : Corsair HX850i 80 Plus Platinum
    PC GAMER
    Always in Next Gen





صفحه 1 از 2 12 آخرینآخرین

موضوعات مشابه

  1. پاسخ: 8
    آخرين نوشته: 23rd March 2013, 10:48 PM

کلمات کلیدی این موضوع

مجوز های ارسال و ویرایش

  • شما نمیتوانید موضوع جدیدی ارسال کنید
  • شما امکان ارسال پاسخ را ندارید
  • شما نمیتوانید فایل پیوست کنید.
  • شما نمیتوانید پست های خود را ویرایش کنید
  •