قابل توجه کاربران گرامی: تاپیک معرفی اعضاء برای آشنایی بیشتر با یکدیگر (حتما شرکت کنید) لینک
نمایش نتایج: از 1 به 4 از 4
Like Tree9Likes
  • 5 Post By asdaf
  • 2 Post By golabettruter
  • 2 Post By asdaf

موضوع: بحث در مورد معماری navi و RDNA امتداد تکامل نسل های قبل

  1. #1
    Active Member
    asdaf آواتار ها
    تاریخ عضویت
    Oct 2013
    محل سکونت
    qom
    نام واقعی
    Mohammad.Ali
    نوشته ها
    225
    تشکر شده 1,657 بار در 231 پست
    asdaf آنلاین نیست.

    بحث در مورد معماری navi و RDNA امتداد تکامل نسل های قبل

    با سلام به همه دوستان گلم

    لیزا سو همه رو غافل گیر کرد و نشان داد که موفقیت رایزن چقدر در بودجه آنها تاثیر گذاشته است
    و بزرگترین تغییر معماری که اون رو اصلا یک نسل جدید برای سال های آینده سخت افزار می کنه داریم

    RDNA طراحی شده برای تمام بازارهای سرور و بازی کامپیوتری تا موبایل هست
    و سامسونگ این معماری را برای گرافیک موبایل های آینده اش لیسانس کرده

    بعد از معماری VLIW که از ILP استفاده میکرد که نقاط قوت و ضعف خودش را داشت
    GCN معرفی شد که شیوه مخصوص به خودش از بهره بری از SIMT را دارد
    GCN به منظور دریافت و ظرفیت بالای اطلاعات طراحی شده بود
    در این معماری میزان وابستگی به نتایج اطلاعات دیگر هیچ گونه تاثیری در سرعت پردازش نداشته است
    و میزان تاخیر محاسبات همیشه یکسان بوده . تمام پردازش ها باید چهار CYCLE طول می کشیدند
    و برای اینکه این میزان تاخیر بالا پوشش داده شود ورودی و همزمانی اطلاعات بالایی داشت تا SIMD ها بیکار نمانند
    نقطه ضعف این معماری در همیشه ثابت بودن سرعت پردازش و تاخیر بالا در پردازش های تک مرحله ای و تک نخی هست

    rdna طراحی شده مخصوص تاخیر پایین و بازدهی پردازش های تک نخی هست
    بخش واحد محاسباتی شدر ها cu از پایه تغییر کرده است .
    پذیرش و ارسال محاسبات در هر یک چرخه رسیده است و هیچ احتیاجی برای منتظر بودن برای چرخه های بیشتر نیست
    ظرفیت نخ simd به 32 تبدیل شده که این میزان متناسب با اطلاعاتی که خودشان بهتر میدانند انتخاب شده
    هر cu می تواند WAVE-FRONT های 32 نخی در یک چرخه یا همانند نسل قبل 64 نخی داشته باشد اما در دو چرخه

    بخش SCALAR که در نسل قبل فقط یکی بود الان دو تا شده . (با توجه به دو تا SIMD 32 و دو اسکالر دیگر تعداد چهار ALU مستقل حفظ شده)
    این اسکالر ها برای از بین بردن نتایج و پردازش های وابسته به صورت سریع مفید هست
    برای پردازش تک نخی در نسل قبل باید چهار چرخه معطل می شد که الان در همان چرخه ارسال میشود
    حالت معطلی اولیه برای تقسیم بندی و دسته بندی همانند gcn وجود ندارد
    و هر دستور العمل با هر تعداد چرخه در همان ابتدا می توانند به هر صورتی بین شدر ها تقسیم شوند



    در معماری قبلی یک بخش دسته بندی بزرگ داشت که الان دو قسمت کوچک شده
    دو cu در کنار هم میتوانند اطلاعات اشتراکی باهم داشته باشند که در کنار یک cu بزرگتر را می سازند
    جدا از سرعت بالای تک نخی این معماری نه تنها چیزی از GCN کم ندارد
    بلکه با این تکنیک ها نیز میتواند پردازش هایی که سرعت بالایی احتیاج ندارند را همانند نسل قبل ظرفیت بالایی داشته باشد



    IPC به معنای دستور العمل های در هر کلاک هست.

    VLIW نشان داده که در بعضی از محاسبات بهتر از SIMT پردازش را محاسبه میکند
    اما اجازه دستکاری کامپایلر و بهینه سازی برای انواع دیگر محاسبات خیلی پایینی داشته
    در صورت ایدئال بودن کد ها برای یک WAVEFRONT میزان IPC 1.25 می دهد

    در gcn این میزان نرخ ثابت 0.25 هست که در چهار کلاک یک WAVE را تکمیل می کند

    RDNA از تکنیک های جدید کامپایلر و فوق استاندارد استفاده میکند که در حالت ایدئال نرخ 1 را میدهد

    شایستگی نام RDNA زمانی مشخص می شود که این معماری تمام قابلیت های نسل های پیشین را دارد
    مهم ترین دستاورد توانایی اجرای ILP در کنار SIMT هست که یک جهان جدیدی از قابلیت های ممکن را باز میکند




    الان از بخش CU خارج می شویم

    گفته شده که ناوی از RDNA نسخه اول استفاده میکند
    و علت ان بهره وری از بهینه سازی هایی هست که برای GCN استفاده شده است
    در غیر این صورت همانند اوایل GCN بازدهی پایینی خواهد داشت و عملا تمام بهینه سازی های قبلی را دور انداخته بودنند

    بعد از جا افتادن کدنویسی های مخصوص CU های ان به لطف کنسول ها
    RDNA نسخه دو که از RAY TRACING به صورت شتاب دهند سخت افزاری بهره می برد؛خواهد امد



    اما با این حال ناوی حرف های زیادی خارج از CU برای گفتن دارد
    در ابتدا تاخیرات کش های L1 و L2 و پهنای باند انها افزایش پیدا کرده است
    تکنیک فشرده سازی رنگ در سطح عمیق استفاده شده که پهنای باند بین اجزای داخلی گرافیک را نیز افزایش داده
    و بخش های جئومتری و خود پردازنده های شدر می توانند مستقیم الگوریتم فشرده را بخوانند و بنویسند !!!!



    گفته شده از فلسفه طراحی ذن استفاده شده و هدف معماری با قابلیت SCALABLE بوده
    این معماری را میتوان به بخش های یکسان با تعداد اجزای یکسان تقسیم کرد!!!!
    در ناوی بخش مرکزی جئومتری وجود دارد که به اجزای PRIM UNIT دستور میدهد و تماما وظایف خودکار و بدون دخالت دارد!!!

    ASYNC نه تنها تاخیر پایینی دارد بلکه توانسته در موارد ضروری با CONTEXT SWITCH همانند انویدیا و با سرعت دیگر پردازش ها را متوقف کند و منابع سخت افزاری بیشتر به خودش بدهد
    این کار خیلی به واقعیت مجازی و vr کمک میکند
    همچنین به لطف ان AMD از قابلیت ضد لگ و تاخیر پایین را در نرم افزار خودش معرفی کرده که با فعال کردن ان لگ و پاسخ دهی بالا میرود

    ناوی در تعداد هسته و سطح تراشه همانند پولارس هست اما با لیتوگرافی 7 نانومتری و تعداد ترانزیستور خیلی بالاتر و مموری GDDR6
    و بازدهی قوی‌تری از وگا 64 با چهار هزار پردازنده شدر
    30 درصد بهینگی و بازدهی رو فقط به لیتوگرافی اختصاص میدهیم . اما 20 درصد بازدهی بیشتر به خود معماری هست
    و با کد نویسی های اختصاصی خیلی بیشتر نیز خواهد شد

    اسلاید های کامل و کیفیت بالا در این لینک وجود دارد
    [Only registered and activated users can see links. ]
    ویرایش توسط asdaf : 14th June 2019 در ساعت 10:46 PM


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  2. 8 کاربر بابت این ارسال مفید از asdaf تشکر کرده اند:

    amirsss (15th June 2019),golabettruter (15th June 2019),magiteq (14th June 2019),msover (15th June 2019),Olesius (18th June 2019),Polonia (19th June 2019),Tereysi (16th June 2019),TERRORIST (14th June 2019)



  3. #2
    Moderator
    magiteq آواتار ها
    تاریخ عضویت
    Sep 2012
    محل سکونت
    تهران
    نام واقعی
    عطا
    سن
    30
    نوشته ها
    3,185
    تشکر شده 16,693 بار در 3,031 پست
    magiteq آنلاین نیست.
    عالی بود ممد جان


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply




  4. کاربر زیر بابت این ارسال مفید از magiteq تشکر کرده است:

    asdaf (14th June 2019)



  5. #3
    Active Member
    golabettruter آواتار ها
    تاریخ عضویت
    Mar 2013
    سن
    34
    نوشته ها
    346
    تشکر شده 1,245 بار در 299 پست
    golabettruter آنلاین نیست.
    درو محمد علی جان با تشکر از شما
    لطفا ادامه بدید متشکرم ...
    Tereysi and Polonia like this.


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  6. 4 کاربر بابت این ارسال مفید از golabettruter تشکر کرده اند:

    asdaf (15th June 2019),Polonia (19th June 2019),Tereysi (16th June 2019),TERRORIST (16th June 2019)



  7. #4
    Active Member
    asdaf آواتار ها
    تاریخ عضویت
    Oct 2013
    محل سکونت
    qom
    نام واقعی
    Mohammad.Ali
    نوشته ها
    225
    تشکر شده 1,657 بار در 231 پست
    asdaf آنلاین نیست.
    نتایج اکثر سایت های بررسی با وجود نبود درایور نهایی .
    این را نشان می دهد که گرافیک های ناوی با رقیب 2070 سوپر و 2060 سوپر شان خیلی رقابت نزدیکی دارند
    amd معماری بیرون داده که از نظر بازدهی و مصرف با انویدیا رقابت میکنه





    یک سایت المانی اولین کسی بوده که فهمیده ناوی به صورت اورکلاک قفل شده هست
    و به سادگی می توان ان را انلاک کرد و با اورکلاک نهایی 5700XT به فرکانس 2.2 گیگاهرتز و مصرف 250 وات می رسیم
    و از نظر بازدهی به 2080 انویدیا نزدیک می شود




    ناوی با وجود لیتوگرافی پایین تر و ترانزیستور بیشتر از انویدیا .قابلیت های سخت افزاری اضافه ای دارد که در اینده مورد استفاده قرار خواهد گرفت
    و دوام و عمر پذیری انرا بیشتر میکند
    msover and golabettruter like this.


    Motherboard Processor
    Main Memory Graphics Card
    Cooling Power Supply

  8. 2 کاربر بابت این ارسال مفید از asdaf تشکر کرده اند:

    golabettruter (14th July 2019),msover (15th July 2019)



کلمات کلیدی این موضوع

مجوز های ارسال و ویرایش

  • شما نمیتوانید موضوع جدیدی ارسال کنید
  • شما امکان ارسال پاسخ را ندارید
  • شما نمیتوانید فایل پیوست کنید.
  • شما نمیتوانید پست های خود را ویرایش کنید
  •