مدتی است که در فهرست مشخصات لپتاپها، دسکتاپها و اولترابوکهای جدید نام پردازندههای جدید اینتل یعنی نسل چهارم خانوادهی Core با عنوان Haswell را میبینیم و طبق معمول این سوال مهم مطرح میشود که تفاوت نسل جدید با نسل سوم یا آیوی بریج چیست؟ در این مطلب میخواهیم نگاهی اجمالی به هسولها داشته باشیم و از آن مهمتر، نتیجهی بهینهسازیهای اینتل را در تستها، بازیها و بنچمارکها ببینیم.
اینتل مدعی است که کارایی نسل جدید با سرعت کلاک مساوی، 5 الی 15 درصد نسبت به آیوی بریجیها یا به عبارت دیگر، نسل سوم خانوادهی Core افزایش نشان میدهد. مصرف انرژی، افزایش خاصی نداشته و در مجموع عملکرد اینتل در طراحی نسل جدید به نظر راضیکننده میرسد، اما انقلابی نیست.
تغییرات اعمال شده در هسول
هسول هم مثل نسل قبلی از لیتوگرافی 22 نانومتری استفاده میکند. از نظر معماری، موتور اجرایی اینتل مثل همیشه بهبود یافته است. اندازهی بافر بیشتر شده و ساختار اطلاعات در هستههای پردازنده بهتر شده است. اجرای خارج از نوبت دستورات (یا OoOE) پیشرفت کرده و لذا اجرای دستورات به صورت موازی، باز هم بهتر از قبل است. بخش بعد از کانال اطلاعات یا به عبارتی پایپلاین، بهتر از قبل پیشبینی میکند و دستورات را تقسیم مینماید.
در هسول دو درگاه اجرایی جدید اضافه شده است، در واقع بعد از اختراع اولین خانوادهی پردازندههای Core در سال 2006 همواره از 6 درگاه اجرایی استفاده میشد تا اینکه اینتل بالاخره این تعداد را به 8 عدد افزایش داده است.
از نظر مجموعه دستورات پشتیبانی شده، AVX2 ( مخفف Advanced Vector Extensions یا نسخهی دوم اکستنشنهای پیشرفتهی برداری) اضافه شده که شامل یک عمل FMA (مخف Fused Multiply-Add به معنی عمل ترکیبی ممیز شناوری جمع و ضرب) است، این عمل خروجی محاسبات ممیز شناوری را تا حد قابل توجهی افزایش میدهد. با دو برابر شدن خروجی ممیز شناوری، کش سطح L1 نیز دارای پهنای باند دو برابر شده تا اطلاعات کافی را به غولهای جدید پردازشی اینتل برساند. در برخی مدلهای هسول از دستورات تراکنشی حافظه یا TSX نیز پشتیبانی میشود.
در هسول تأخیر بیشتری در دسترسی به حافظه وجود دارد، البته در تمام مدلها و تمام محدودهی حافظه این وضعیت قابل مشاهده نیست:
کش L3 نقشهی جداگانهای برای انرژی مصرفی و فرکانس کاری خود دارد و به نظر میرسد که آرامتر از قبل مشغول فعالیت است. در واقع دسترسی به آن با تأخیری در حد 2 تا 3 سیکل انجام میشود که حاصل جدا کردن کش L3 است.
هسول و توان مصرفی کمتر
هسولها در مجموع مصرف انرژی کمتری دارند. به خصوص هسولهای سری U و Y که برای اولترابوکها و تبلتها در نظر گرفته شدهاند.
سوییچ بین حالات مختلف مصرف انرژی چیپست و هستههای پردازنده، حدود 25 درصد سریعتر از آیوی بریج است. بنابراین مدیریت مصرف انرژی بهتر از قبل صورت میگیرد و انتخاب حالات کممصرف با سرعتی بالاتری انجام میشود. در حالت بیکار نیز انرژی مصرفی پلتفرم کاهش زیادی داشته است.
در نمودار زیر انرژی مصرف پردازندههای هسول و آیوی بریج در کنار مادربوردهای Z77 Deluxe و Z87 Deluxe ایسوس نمایش داده شده است:
البته این تنها به پردازندهی اینتل مربوط نمیشود، ایسوس هم برای ارائهی محصول بهتر و فروش بیشتر، تلاش خود را کرده است اما به هر حال ادعای اینتل مبنی بر اینکه نوتبوکها و اولترابوکهای هسولی 50 درصد کممصرفتر بوده و تا 9 یا 10 ساعت با شارژ باتری روشن میمانند، بیاساس نیست.
مصرف انرژی هسول در بار سنگین پردازشی بیشتر از آیوی بریج است، مثلاً بار پردازشی اینکودر ویدیویی x264 که با استفاده از تمام هستهها، ویدیو را تبدیل میکند.
بنابراین اگر از نوتبوک هسولی در بار پردازشی سنگین استفاده شود، مصرف انرژی آن کم و بیش مشابه مدلهای آیوی بریجی خواهد بود.
Core i7-4770K نسبت به پرچمدار نسل قبل یعنی Core i7-3770K حدود 11 درصد بیشتر مصرف کرده و 13 درصد کارایی بالاتری دارد. لذا کارایی به ازای هر وات برق مصرفی، افزایش کوچکی داشته است.
هسول و کنترلر حافظهی بهتر، اورکلاک سادهتر
در هسول کنترلر حافظه پیشرفت خوبی داشته است. البته آیوی بریج هم بسیار عالی است اما هسول دیو قدرتمندی در زمینهی اورکلاک کردن حافظه به حساب میآید.
هسول و درگاهها و اتصالات جانبی کاملتر
در چیپستهای سری 8 اینتل از سوکت 1150 پینی پردازنده استفاده شده است و لذا نمیتوان پردازندههای جدید را در مادربوردهای سری 7 قرار داد. شاید علت این تغییر شدید، تغییرات اساسی به وجود آمده در رابطه با انتقال توان مصرفی است.
در چیپست سری 8 نهایتاً 6 درگاه SATA 6 Gb/s وجود دارد، چیزی که در 7 به 2 عدد محدود شده بود. 4 درگاه یواسبی 3 نیز پشتیبانی شده است.
اورکلاک کردن یک هسول
در هسول از رگولاتور ولتاژ کاملاً یکپارچه با پردازنده یا به اختصار FIVR استفاده شده است، بنابراین توان مصرفی از 77 واتی که در آیوی بریج دیده بودیم، به 84 وات افزایش یافته است چرا که مدیریت توان مصرفی پیشرفتهتر شده است.
محدودیتهای اورکلاکی که با معرفی سندی بریج شروع شد و در آیوی بریج هم ادامه داشت، باز هم وجود دارد. بنابراین تمام مدلهای معمولی از نظر فرکانسی قفل هستند یا به عبارت بهتر، نمیتوان ضریب کلاک پایه را به صورت دلخواه انتخاب نمود. اما در مدلهای سری K باز هم مثل قبل همه چیز کاملاً آنلاک شده است. یکی از تغییرات مهم این است که میتوان برای کلاک پایه یا BCLK سه حالت انتخاب کرد، 100، 125و 167 مگاهرتز. بنابراین هسول در اورکلاک کردن، انعطاف بیشتری از خود نشان میدهد.
در هسول با ولتاژ 1.2 الی 1.35 ولت میتوان به سرعت کلاکی بین 4.3 تا 7 گیگاهرتز دست یافت. البته با استفاده از خنککاری با هوا و در نظر گرفتن این موضوع که در سرعتهای بالای 5 گیگاهرتز، خنککاری سیستم باید کارایی بالایی داشته باشد.
روند معرفی پردازندههای جدید
امسال اینتل از پردازندههای قدرتمند 4 هستهای شروع میکند و تدریجاً 2 هستهایها و مدلهای ویژه اولترابوکها و نوتبوکهای سبک را روانهی بازار خواهد کرد. خانوادهی جدیدی از محصولات با پسوند R نیز در راه هستند که دارای سوکت معمولی نمیباشند. منظور از سوکت BGA یا Ball Grid Array در این تراشهها این است که سطح زیرین با شبکهای از کرههای لحیم پوشانده شده و مستقیماً روی برد مدار چاپی مادربورد، لحیم میشوند. Core i7-4770R یکی از این مدلهاست که از گرافیک قدرتمند و جدید Iris Pro 5200 استفاده میکند. باقی مدلها از گرافیک GT2 یا HD 4600 بهره میبرند که 20 واحد اجرایی دارد و نسبت به HD 4000 با 16 واحد اجرایی، سریعتر است. GT3e آیریس پرو 5200 دارای 40 واحد پردازشی و حافظهی داخلی DRAM است و در ادامه بیشتر به آن میپردازیم. کش L3 مدل Core i7-4770R نیز به 6 مگابایت تقلیل یافته است.
تمام Core i7ها دارای تکنولوژی هایپرتردینگ هستند و به عبارت دیگر 4 هستهی واقعی و 4 هستهی مجازی دارند تا عملکرد بالاتری داشته باشند. مدلهایی با پسوند S نسبت به مدلهای معمولی، کمتر در فرکانس توربوبوست فعالیت میکنند و این به علت مصرف انرژی کمتر است. مدلهایی با پسوند T توان مصرفی پایینتری دارند و لذا مدت زمان کمتری در فرکانس کاری ماکسیمم کار میکنند. پشتیبانی از AVX2، Quick Sync، AES-NI، PCIe 3.0 و تکنولوژی مجازیسازی اینتل در تمام مدلها وجود دارد. در 4770K و 4770R از vPro، TXT، VT-d و SIPP نیز پشتیبانی میشوند.
پردازندههای Core i5 با قیمت دو سوم، کارایی بسیار بالایی دارند که اغلب اوقات به مدلهای Core i7 نزدیک است. در این محصولات هایپرتردینگ و به عبارتی هستههای مجازی وجود ندارد. تمام مدلها از گرافیک HD 4600 استفاده میکنند. هیچ یک از مدلها از vPro، TXT و VT-d پشتیبانی نمیکند.
فعلاً خبری از مدلهای 2 هستهای و مدلهای Core i3 نشده است. شاید فصل آتی مشخصات این مدلها منتشر شود.
مساحت و تعداد ترانزیستور
امسال مطابق معمول تعداد ترانزیستور در پردازندههای اینتل افزایش داشته است. مساحت روند نزولی که از سندی بریج تا آیوی بریج دیده میشد را طی نکرده و در بیشتر مدلها، سطح قالب تراشه افزایش داشته است.
در مدلهایی که از گرافیک قدرتمند GT3 استفاده میکنند، مساحت 87 میلیمتر مربع بیش از مدلهایی است که از GT2 بهره میگیرند. بنابراین مدلهایی که از 40 واحد پردازش گرافیکی استفاده میکنند احتمالاً افزایش دوبرابری در مساحت دارند یعنی 174 میلیمتر مربع بزرگتر هستند. جالب است که در یک پردازندهی 4 هستهای هسول با گرافیک GT3 حدود 65 درصد سطح قالب به پردازندهی گرافیکی اختصاص مییابد. این رقم در مورد تراشههایی با گرافیک GT2، تنها 33 درصد است. 128 مگابایت حافظهی eDRAM نیز 84 میلیمتر مربع به بستهی کلی تراشه اضافه میکند.
اما به یک نکتهی جالب توجه کنید. یک هسول 4 هستهای با گرافیک GT2 و 1.4 بیلیون ترانزیستور مساحت تراشه برابر با 177 میلیمتر مربع است. در یک آیوی بریج با 1.2 بیلیون ترانزیستور و گرافیک GT2، مساحت تراشه 160 میلیمتر مربع بود. بنابراین نتیجه میگیریم که هسول با 17 درصد ترانزیستور بیشتر تنها 11 درصد بزرگتر است. علاوه بر ترانزیستورهای بیشتر، شامل پردازندهی گرافیکی بزرگتر و قابلیتهای دیگری نیز هست. بنابراین به این نتیجه میرسیم که اینتل معماری جدید خود را کوچکتر از آیوی بریجی که خود یک تراشهی فوقالعاده کوچک بود، طراحی کرده است.
کارایی پردازنده
هوسل نسبت به آیوی بریج بین 1 الی 19 درصد سریعتر است و میانگین 8.3 درصدی افزایش سرعت پردازش، یک رکورد خوب است. نسبت به سندی بریج نیز بین 7 تا 26 درصد افزایش سرعت وجود دارد. البته با توجه به نتیجهی بنچمارک Kraken میتوان گفت که افزایش 7.8 درصدی سرعت محاسبات، نشانگر این است که هسول هنوز هم جای بهینهسازی دارد.
اولین بنچمارک که سرعت پردازنده را در انجام محاسبات تکتردی و چند تردی نشان میدهد، Cinebench 11.5 است. نتیجه را در نمودارهای زیر ببینید:
مشاهده میکنید که فقدان هایپرتردینگ در مدل Core i5 هسول، عملکرد چند تردی آن را نسبت به رقبای نسلهای قبلی که دارای هایپرتردینگ و به عبارتی هستههای مجازی هستند، تا چه حد پایین آورده است.
تست بعدی نرمافزار معروف فشردهسازی فایل یعنی 7-zip میباشد، این بار هم عملکرد به صورت تک تردی و چند هستهای مورد مقایسه قرار میگیرد:
بنچمارک جاوااسکریپت در مرورگر کروم:
بنچمارک تبدیل فایل ویدیویی با اینکدر معروف x264:
بنچمارک رمزگذاری TrueCrypt:
تست کامپایل کردن موزیلا فایرفاکس در ویژوآل استودیوی 2012:
جالب است که هسول در کامپایل کردن 15 درصد سریعتر از آیوی بریج عمل کرده، آن هم با فرکانس کاری یکسان. این تست نشان میدهد که بهینه شدن هسول از نظر تعداد دستوراتی که در یک سیکل کلاک انجام میشود، یا به عبارتی بهبود IPC چه تأثیری در کاربردهای روزمرهی یک برنامهنویس دارد.
نگاهی عمیقتر و دقیقتر به پیشرفت اینتل در بهینه کردن پردازندهها برای محاسبات تکتردی داشته باشیم:
کارایی در بازیها
هسول در اجرای بازی با استفاده از یک کارت گرافیک HD 7970 در رزولوشن 1440p کمی بهتر از نسل قبلی عمل کرده است، دو بازی Civilization V و Dirt 3 را به عنوان نمونه مقایسه میکنیم:
کارایی Quick Sync
اینتل مدعی است که تمرکز خود را روی بهبود کیفیت تبدیل ویدیو از طریق Quick Sync گذاشته است. اما متأسفانه کیفیت ویدیو تقلیل کمی داشته ولیکن عملکرد آن افزایش یافته است. علت اصلی افزایش سرعت، افزایش تعداد واحدهای اجرایی در پردازندهی گرافیکی است. مخصوصاً در مورد هسولهایی با پردازندهی گرافیکی قویتر و 128 مگابایت حافظهی کش سطح 4 که Core i7-4950HQ یکی از این مدلهاست.
توجه داشته باشید که برتری 4770K در نمودار زیر به علت سرعت کلاک بالاتر است، چیزی که در 4950HQ با به کارگیری 128 مگابایت کش L4 و پردازندهی گرافیکی برتر، جبران میشود:
بررسی کارایی پردازندهی گرافیکی مجتمع جدید اینتل
HD 4000 اینتل را کم و بیش میشناسیم. یک پردازندهی گرافیکی مجتمع با 16 واحد پردازشی یا EU که در آیوی بریج استفاده میشد. نام این پردازنده GT1 است.
در هسول GT2، GT3 و GT3e نیز وارد میدان رقابت شدهاند. GT2 یا مدلهای HD 4200، HD 4400 و HD 4600 دارای 20 واحد پردازشی هستند. نسخهی مخصوص این پردازنده برای سرورها و ایستگاههای کاری نیز P4600 و P4700 میباشد.
برادر بزرگتر این خانواده GT3 است که 40 واحد پردازشی دارد و فرکانس کاری آن کمتر از 1.1 گیگاهرتز است. اگر فرکانس کاری GT3 به رقم 1.3 گیگاهرتز برسد، نام آن از HD 5000 به Iris 5100 تغییر میکند. بله، این بار اینتل هم مثل رقبای خود یعنی انویدیا و ایامدی، برای پردازندههای گرافیکی خود اسم انتخاب کرده است. البته هنوز به مرحلهای نرسیده که برای تکتک مدلها، اسامی هیجانانگیز و جالب انتخاب کند. آیریس پرو 5200 یا GT3e نیز قدرتمندترین گرافیک مجتمع اینتل است که علاوه بر 40 واحد پردازشی و سرعت کلاک بالا، دارای 128 مگابایت حافظهی eDRAM یا حافظهی داخلی DRAM است.
قدرت پردازش خام این پردازندهها بسیار متفاوت است. اما در بهترین حالت 3 برابر از نسل قبلی سریعتر هستند و رکورد 832 گیگافلاپسی از خود به جای میگذارند. این رقم در مقایسه با تایتان انویدیا و نپتون ایامدی که بیش از 3 ترافلاپس قدرت دارند، بسیار کمتر است اما با توجه به توان مصرفی و قیمت تمام شده، برای مشتریانی که بودجهی کافی ندارند، بسیار عالی است. علاوه بر این توجه داشته باشید که آیریس پرو 5200 بیشتر از کارت گرافیک مخصوص وسایل همراه GT 650M و حتی GT 750M قدرت دارد. جالب است که A6X پردازندهی آیپد 4 اپل که یکی از بهترین پردازندههای گرافیکی به کار رفته در تبلتهاست، در مقابل آیریس پرو 5200 هیچ شانسی ندارد:
حتی APUهای نسل قبلی ایامدی هم شانسی برای رقابت با آیریس پرو 5200 ندارند گرچه نسل جدید تراشههای ایامدی نیز پیشرفت قابل توجهی داشته است:
توان مصرفی GT3 تنها 28 وات است، اما ببینیم با این توان مصرفی پایین در اجرای بازیهای امروزی چطور ظاهر میشود؟ همهچیز را در اجرای چند بازی سنگین خلاصه میکنیم. بازیهای تومب رِیدر، کرایسیس 3، بتلفیلد 3 و بایوشاک اینفینیت را به عنوان نمونه انتخاب کردیم:
جمعبندی
هسول از نظر اجرای دستورات پردازشی به صورت تکهستهای یا چند هستهای پیشرفت نسبتاً خوبی نسبت به آیوی بریج داشته است. اما تمرکز اصلی اینتل بر معرفی تراشههای کممصرف که پردازندهی گرافیکی بهتری دارند بوده و نتایج تستها و بنچمارکها نیز موید این مطلب است.
هسولهایی با گرافیک آیریس و آیریس پرو 5200 نسبت به کارت گرافیکهای جداگانه، عملکرد بسیار خوب و رضایتبخشی دارند. علاوه بر این مصرف انرژی پردازندهی اصلی و پردازندهی گرافیکی در مجموع، بسیار پایین است به طوری که در اولترابوکها و لپتاپهای سبکی که در آینده رونمایی میشوند، بیش از پیش شاهد استفاده از تراشههای هسول بدون کارت گرافیک جداگانه خواهیم بود.
این بار اینتل در رقابت با APUهای ارزانقیمت ایامدی که دارای گرافیک مجتمع HD 7660D و HD 7660G و مدلهای ضعیفتر هستند، عملکرد خوبی داشته و در تستها بالاخره از پس این محصولات ارزانقیمت برآمده است. اگر در زمینهی قیمتگذاری هم موفق باشد، موفقیت بیشتری کسب خواهد کرد اما باید ببینیم نسل جدید تراشههای ایامدی چطور از پس اینتل بر میآیند.
نظر شما در مورد هسول چیست؟ به نظر شما برای بازیها میتوان از آن استفاده کرد و کارت گرافیک جداگانه را کنار گذاشت؟ در مورد دسکتاپ چطور؟ آیا بر کارت گرافیکهای رده پایین دسکتاپ غلبه خواهد کرد و مشتریان را به سمت خود خواهد کشید؟ برای دسکتاپ و همچنین نوتبوک، شما کدام را انتخاب میکنید، گرافیک مجتمعی از ایامدی یا اینتل و یا به کلی سراغ کارت گرافیک جداگانهای از انویدیا یا ایامدی میروید؟