با احترام شما شیوه و کلمات خودتون برای توضیح رو دارید.
اکثر چیزهایی که دوباره توضیح دادید رو قبول دارم . و توی تاپیک خودم بهش پرداختم
اما منظورم از ریز عملیات ریجستر با توجه به تصویر نا مناسب به مطلبتان که گذاشتید میشد
اون خط های انتقال که بین مراحل خط لوله است بهش ریز عملیات میگند .
اما خواندن ریجستر عملیات نیست . درسته در خط لوله مرحله ای به نام fetch وجود داره .اما در واقع خواندن دستورات از رم و ارسال ان میشه نه ریجستر !
مطمعن باشد همیشه دیکود و fetch و WB و EX در همه جا از ستون پایه و ضروری محسوب میشه و نمیدونم چطور میگید ممکنه بعضی جاها نباشه .
ALU توی اسلاید ها ممکنه به کل یک خط لوله SIMD بگند یا فقط به مرحله EX ان
چیزی که شما از stage میگید همون مرحله همشون یک پردازش و عملیات به حساب میاند . و ALU خودشون رو دارند اما بهش ALU نمیگند
ممکنه همه ALU های انها در یک SIMD جمع شوند یا اینکه به صورت جداگانه باشند
باید هم بین issue و ریز عملیات خواندن ریجستری یک تفاوتی بگذارید و نباید با هم قاطی بشند
issue که شما تعریف کردین منظور من از همون دستورالعمل است . که مرحله به مرحله میرود و در اخر همیشه در هر کلاک یک دستورالعمل کامل شده در پاپلاین به اصطلاح 1 issue بیرون در مرحله اخر ان میاد
دو issue شدن یا دو دستورالعمل شدن شاید مراحلی که برای یک دستورالعمل میرود تغییری نکند و همون 5 مرحله باشد اما خاصیت SIMD اینه که سرعتش با ضرفیت بیشتر کاهش پیدا میکنه یعنی تاخیر بالا میره.
مسلما پردازنده ای که اگه تو یک چرخه دو دستور العمل بده کلاک بالاتری از پردازنده ای که یک دستورالعمل داره به حساب میاد.
مگه اینکه کلا انها را جدا گانه و مستقل حساب کنیم
ممکنه چند پاپلاین کوچیک کنار هم به صورت موازی باشند یا اینکه هر دو را در یک پاپلاین بزرگ ترکیب کرد .
اما اینکه چقدر ALU یا سخت افزار توش مصرف شده تغییری نمیکنه . البته برای تاخیر یک دستورالعمل و مراحلی که می پیماید فرق وجود دارد
مثلا توی این عکس
گفته هر int از بولدوزر چهار پاپلاین داره نگفته که دوتا.... اما ممکنه یک دستورالعمل فقط از یکی از پاپلاین ها استفاده کنه .
اما دلیل نمیشه بقیه رو حسابش نکنیم یا اینکه همه رو یک خط لوله با issue زیاد حساب کنیم چون واقعا هم زمان نیستند !!
اما اگه طبق پاپلاین 2 issue در نظر بگیریم اینکه یک دستورالعمل باشه یا دو تا رو issue کنه باز هم طبق گفته خودتون در تاخیر فرقی ایجاد نمیشه .
توی این قسمت شواهدی موجود نیست که چهار تاست یا دوتا اما تصاویر به نفع منه .
توی zen هم دستاورد مهم اش اینه که پاپلاین های جانبی بیکار باقی نمی مانند. توسط چند نخی
حالا اگر در مورد طول خط لوله یا پاپلاین باشه برای حداکثر زمان دستور العمل بزرگترین پاپلاین رو حساب میکنند و برای حداقل کوچک ترین رو
تا اینجا اشتراک زیادی داریم و یک چیز پیش پا افتاده به حساب میاد
همه هسته ها int و fp رو دارند اما برخلاف بودلوزر و معماری zen و روش Amd ،انگار اینتل در مورد اسکای لیک یک فضای دسته بندی مشترک برای int و fp داره طبق تصویر
توی اینتل انگار fp و int یک نخ یا دستور مشترک رو دارند اما توی amd نوع دستورالعمل پردازشی مستقل هست
خوب اگه برنامه ها نیاز بیشتری دارند به fp به ضرفیت ان بر میگرده نه به مسیر انها
در مورد نظریه اخرتون چیزی رو اثبات نکردید
و البته جملات ضرفیت ریجستری با هم تناقض داره
یکی از راه های کاهش مصرف کش دسته بندی درست هست
________________
بشخصه از کلمه واکاشی خیلی بدم میاد . اصلا معلوم هست ریشه اش کجاست و مفهومش چیه
برو بیارش یا پرتاب قشنگ تر هست. ساختار های ساده و منظم و متمایز توی کتاب های درسی بذارند