PCIe 1x в якості 16x. Як використати залізо по максимуму.


Натрапив в інтернеті на інформацію про наявність адаптерів для PCIe X1 слотів із можливістю встановлення PCIeX4 PCIeX8 PCIeX16 пристроїв.

Крім самого адаптера в мене виникла підозра, що можуть існувати готові рішення і це дійсно виявилось правдою.
Ось приклад професійного чотириядерного чотириголового PCIe x1 відеоадаптера.

NVIDIA Quadro NVS 440 by PNY graphics board for PCI Express (x1 lane slot)

Рішення просто чудове, що дає можливість працювати з професійною 2D графікою на серверних платформах і не тільки.

А не тільки, бо практично в кожної материнської плати класу Desktop наявні кілька PCIe X1 слотів, які, за моєї особистої практики переважно вільні.

Крім того, дана можливість дає виграш тим користувачам, що в свій час, коли PCIe відеокарти були дуже дорогими, придбали материнки з вбудованими графічними адаптерами.

Для любителів халяви.

Якщо не хочеться платити по 20$ за перехідники, є інший вихід - молотка і напильника.

PCIe x16 inside x1 PCIe lane

Рішення реально діюче, хоча й вимагає акуратності при роботі.

Мабуть дуже цікавим буде варіант саме з бюджетного боку. Набрати жменю відеокарт класу 50$ та насовати їх в усі доступні слоти PCIe X1. В результаті можна отримати досить таки продуктивну систему.
Скажімо Ви захотіли до існуючої повноцінної x16 відеокарти додати в режим SLI або CrossFire ще одну або 5 8)))) відеокарт, яка буде використовуватись для покращення математики та продуктивності всієї відеопідсистеми.

Щодо продуктивності такої системи.

В інтернеті можна знайти кілька тестів-порівнянь для однакових відеокарт в режимі x16 проти x1. Все, що я знайшов - це втрати продуктивності від 0% до 16% в залежності від тестів.
Найменше втрачає 2D підсистема. Найбільше - ігрові програми.
Як відомо - швидкість PCIe v1.1 X1 lane - 0.5 Гігабайт в секунду, а для PCIe v2.0 X1 lane - 1 Гігабайт в секунду. Цього в більшості випадків достатньо для практично будь-якого додаткового обладнання аж до класу entry-level серверів.

PCIe X1 adapter to PCIe X16

Для прикладу - RAID масив із 8 SAS дисків в режимі Stripe (RAID0) може теоретично максимально вижати 800 Мегабайт в секунду станом на 2008-2009 рік. А такого класу масив ставиться дуже рідко, бо реальних потреб не завжди знайдеш (я тут не враховую Hi-end системи!).

Враховуючи все вищесказане - буду проводити тести щодо встановлення додаткового обладнання в існуючі PCIe X1 слоти. На черзі - SAS3442E від LSI ну і звичайно - додаткові відеоадаптери.

Щоб не створювати додаткової статті по цій же самій темі - допишу сюди.
Розпиляв на своїй Asus P5K-SE один із слотів PCIe X1 і встановив туди відеокарту.
Після того порівняв швидкодію, вставивши цю ж саму відеокарту в PCIe X16 слот(на рідне її місце)

PCIe X1 Geforce 6200 Turbo Cache 256Mb

Results 124.61
System Info
Xbench Version 1.3
System Version 10.5.6 (9G55)
Physical RAM 2048 MB
Model iMac7,1
Drive Type SAMSUNG HD501LJ SAMSUNG HD501LJ
Quartz Graphics Test 121.96
Line 125.40 8.35 Klines/sec [50% alpha]
Rectangle 128.52 38.37 Krects/sec [50% alpha]
Circle 108.48 8.84 Kcircles/sec [50% alpha]
Bezier 141.16 3.56 Kbeziers/sec [50% alpha]
Text 111.88 7.00 Kchars/sec
OpenGL Graphics Test 89.23
Spinning Squares 89.23 113.19 frames/sec
User Interface Test 214.23
Elements 214.23 983.22 refresh/sec

PCIe X16 Geforce 6200 Turbo Cache 256Mb

Results 149.24
System Info
Xbench Version 1.3
System Version 10.5.6 (9G55)
Physical RAM 2048 MB
Model iMac7,1
Drive Type SAMSUNG HD501LJ SAMSUNG HD501LJ
Quartz Graphics Test 182.46
Line 172.14 11.46 Klines/sec [50% alpha]
Rectangle 219.54 65.54 Krects/sec [50% alpha]
Circle 180.51 14.71 Kcircles/sec [50% alpha]
Bezier 176.78 4.46 Kbeziers/sec [50% alpha]
Text 171.16 10.71 Kchars/sec
OpenGL Graphics Test 89.26
Spinning Squares 89.26 113.23 frames/sec
User Interface Test 292.57
Elements 292.57 1.34 Krefresh/sec

Згідно ключових моментів - спад продуктивності від 0% до 30%. Дуже здивував показник OpenGL - виявляється даній технології непотрібна висока продуктивність шини даних.
Тест проводився на одному і тому ж самому конфігу та системі з допомогою XBench.

Trackback URL для цього допису

http://itua.name/uk/trackback/487
Share this

Налаштування перегляду коментарів

Виберіть потрібний метод показу коментарів і натисніть "Зберегти налаштування".
Зображення користувача jin.

Практичне використання - (як

Практичне використання - (як я його бачу) - наставити вдеоадаптерів із за допомогою CUDA перетворити їх у числомолотилку (наприклад при кодуванні відео), значно ефективнішу, аніж 2-4 процесори класу Xeon

Зображення користувача podarok.

Дуже спірно!

Важко довести твої слова...
Буде двохголовий чотириядерний Зіон - обов'язково тестану парочку дешевих карток з тим CUDA і спробую провести певну аналогію...
А так - дуже складно порівняти скажімо обрахункові потужності 2-3 гігового чотириядерного зіона помноженого на кількість два із 400-1200 мегагерцовими відеопроцесорами.

Зображення користувача jin.

будеш мати можливість - перевір

на простих операціях які добре розпаралелються сучасні GPU добре обходять сучасні CPU, по простій причині - вони складаються із великого числа простих процесорни блоків, наприклад у архітектурі G92 є 64 "процесори". Власне по цій причині і маємо високу продуктивність і у Sony PS3 (їх навіть для побудови кластерних суперкомп'.nерів використовують :)) - завдяки наявністі Cell процесорів, який по факту є одним PowerPC + "пачка" простих "числомолотилок".

Зображення користувача jin.

і для прикладу - лінк

ось він. Я розумію, що це рекламні матеріали, але ж вони брешуть не на порядок :) якщо матимеш можливість провести експеримент - буде дуже цікаво подивитись резуьтати

Зображення користувача podarok.

112 універсальних процесорів 0_о

G92 - процесорна ферма?
Мдя... Цікава інформація і поле для роздумів. Буду поглиблюватись в технічні деталі трохи.

Зображення користувача incognito1.

не прикольно

Ну і навіщо на серверних платформах 2Д графіка? не доганяю, може для обробки математичних задач (спецпрограми)? графіка на сервері може бути в одному випадку - це сервери DreamWorks Pictires чи інших - для обробки рендерінгу мультиків.

Зображення користувача podarok.

потрібно... графічна станція

потрібно...
графічна станція в поліграфії використовує саме 2D
Серверні платформи з своїми обчислювальними можливостями - саме те.
Відповідно комбінація такого заліза - чудове рішення як по фінансам, так і по продуктивності.

Зображення користувача The Lex.

А слабшої відеокарти нема?

Бо якщо поставити слабшу - відмінність результатів "PCIe x1 vs PCIe x16" буде ще виразнішою. Точніше, відсутність будь яких відмінностей. :)

А от з RAID контролерами хоча б на 4 "справжніх" порти ситуація буде вже цікавішою - давай ще такі тести! Доречі, в мене є материнка з "відкритим" PCIe x4 - можемо протестити на ній якийсь дисковий контролер, але... Як на мене, для домашнього вжитку це все трохи... Побавитися з залізом, звісно, самому цікаво - але окрім "конструктора для дорослих хлопчиків" іншого реального практичного застосування - навряд.

ЗИ: картка сабжева доволі слабка - вона навіть "цифру" лише не більше 1920х1200 підтримує - нащо вона вдома чи у бізнесі, окрім бажання приєднати до компа 4 монітори?

Стосовно "числодробилки на відео PCIe x1" - імхо, буде невеличка проблема у постановці завдань: мало мати супер-пупер обчислювач - йому ще треба дані завантажити, позаяк у нього самого "його власної памяті" для більш-менш вартих того обчислень малувато: усього 256 МБ "сабжевих", та й шина даних внутрішня 128 біт - це не так вже й густо, про що сучасні потужні ігрови карти яскраво свідчать. Але у випадку інтерфейсу до загальної системи на PCIe x1 саме останній стане "вузьким горлом" і, як на мою нескромну думку, зведе нанівець усі можливі плюси такої системи. Чи може виробники потужніх дискових контролерів дарма роблять їх на x4? Про замалу потужність відеокарти у тесті я вже казав - давай поставимо щось сучасніше рівня хоча б nVidia 9500 - і побачимо що з того вийде.

І ще: наскільки я пам'ятаю архітектуру чіпсета, "невідяшні" PCIe приєднані до нього "не напряму", а "через південний міст" - на відміну від центрального процесора, оперативної пам'яті, і "відяшних" роз'ємів. А сам "південний міст" під'єднано до "північного" - на якому вже сидять проц і оперативка - через окрему шину PCIe і ширина її, якщо я правильно плутаю, x4 на _всіх_. Тобто на ці x4 ми повісимо, щонайменше, усі наші дискові масиви, зовнішні пристрої, а до них додамо ще й відеокарти. Щоправда, для серверних чипсетів це може бути не зовсім так чи навіть зовсім не так.

Побачимо що тут буде далі... :)

Зображення користувача podarok.

2600XT Radeon

Буду тестувати...

Збір матеріалів Збір матеріалів

Партнери

Останні коментарі

експерименти

Rambler's Top100