HLFX.Ru Forum
профиль •  правила •  регистрация •  календарь •  народ •  FAQ •  поиск •  новое •  сутки •  главная •  выход  
HLFX.Ru Forum HLFX.Ru Forum > Наш форум > Технические вопросы > BLAS (базовые подпрограммы линейной алгебры)
Страницы (3): « 1 2 [3]   Предыдущая тема   Следующая тема
Автор
Тема Новая тема    Ответить
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



именно с векторизацией ? т.е. 4 float за 1 команду высчитывать ?
или просто команда на принудительное использование sse ?

Цитата:
XaeroX писал:
Надо профилировать каждый кусок, потому что где-то она даёт прирост, а где-то наоборот оказывается медленнее. Общих рецептов нет.

ну учитывая, какой разброс дают матбиблиотеки - предположу, что там не 1 подход и сильная зависимость какой подход в данный момент лучше

Сообщить модератору | | IP: Записан
Сообщение: 100267

Старое сообщение 10-06-2012 19:00
- За что?
 XaeroX
Crystice Softworks

Дата регистрации: Oct 2005
Проживает: Торонто
Сообщений: 34523
Нанёс повреждений: 514 ед.
Возраст: 37

Рейтинг



Награды
 
[1 награда]


Цитата:
underworlddemon писал:
именно с векторизацией ? т.е. 4 float за 1 команду высчитывать ?

Да, именно векторизация, ассемблер.
Пробовал и интринсики, но они гораздо менее эффективны оказываются, т.к. не всегда получается реюзать регистры.
Команда (ты про gcc -msse?) вроде просто включает поддержку интринсиков.

__________________

Сообщить модератору | | IP: Записан
Сообщение: 100268

Старое сообщение 10-06-2012 19:08
-
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



Цитата:
underworlddemon писал:
или просто команда на принудительное использование sse ?

Цитата:
XaeroX писал:
Команда (ты про gcc -msse?) вроде просто включает поддержку интринсиков.

точно включает, но вроде ещё и пытается векторизовать (но тут как компилятору покажется правильнее в конкретном случае)

принудительно, да ещё и выровнено - это уже не так просто, чтобы компилятор сам смог

Сообщить модератору | | IP: Записан
Сообщение: 100273

Старое сообщение 10-06-2012 19:19
- За что?
 XaeroX
Crystice Softworks

Дата регистрации: Oct 2005
Проживает: Торонто
Сообщений: 34523
Нанёс повреждений: 514 ед.
Возраст: 37

Рейтинг



Награды
 
[1 награда]


Цитата:
underworlddemon писал:
принудительно, да ещё и выровнено - это уже не так просто, чтобы компилятор сам смог

Об этом и речь.
Такие вещи, как оптимизация боттлнеков, лучше компилятору не доверять. Это одна из тех немногих вещей в современном программировании, где реально нужен человеческий мозг.

__________________

Сообщить модератору | | IP: Записан
Сообщение: 100280

Старое сообщение 10-06-2012 19:30
-
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



Цитата:
XaeroX писал:
Это одна из тех немногих вещей в современном программировании, где реально нужен человеческий мозг.

ну матлибы как раз и позволяют упростить некоторым образом работу ибо берут это на себя и минимизируют ошибки\опечатки (за счёт минимизации кода)
ведь о многих низкоуровневых вещах позаботились на уровне самой библиотеке и думать о них уже не надо (ну только проверить правильность )

обновляем библиотеку = обновляем оптимизации под железо
т.е. не надо вручную переписывать, достаточно скомпилировать с новым флагом

я не прав ?

Сообщить модератору | | IP: Записан
Сообщение: 100284

Старое сообщение 10-06-2012 19:36
- За что?
 XaeroX
Crystice Softworks

Дата регистрации: Oct 2005
Проживает: Торонто
Сообщений: 34523
Нанёс повреждений: 514 ед.
Возраст: 37

Рейтинг



Награды
 
[1 награда]


underworlddemon
Авторы библиотек - тоже люди, и они не безгрешны.
А наказывать шеф будет тебя, а не автора библиотеки. Так что выбор твой, конечно.

__________________

Сообщить модератору | | IP: Записан
Сообщение: 100285

Старое сообщение 10-06-2012 19:39
-
 Дядя Миша
racing for fish

Дата регистрации: Oct 2005
Проживает: Кубань
Сообщений: 32210
Нанёс повреждений: 392 ед.

Рейтинг



Цитата:
underworlddemon писал:
но думаю про векторизацию и ассемблерные вставки ты не заморачивался

так я же говорю - узкое место, оно не там.
вы все прекрасно знаете, что ксаш бодрее халфы при прочих равных условиях. На самой обычной матлибе. Даже если прикрутить туда супер быструю матлибу, сам ксаш уже быстрее не станет, хоть убейся. Потому что боттлнек в использовании глбегин. А оптимизировать это место я не могу, поскольку начнутся проблемы со всякими хлфхами-параноями, вернее всего. Точнее так: тупая замена глбегин на арреи вполне возможна, но прироста от такого подхода не будет. Там придется капитально перепахать рендерер. Ну и как следствие - похерить всю совместимость. Поэтому я подобные фокусы практикую исключительно в ксаш-модах, благо архитектура движка позволяет.

__________________
My Projects: download page

F.A.Q по XashNT
Блог разработчика в телеграме

Цитата:

C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'

Сообщить модератору | | IP: Записан
Сообщение: 100286

Старое сообщение 10-06-2012 19:41
-
 XaeroX
Crystice Softworks

Дата регистрации: Oct 2005
Проживает: Торонто
Сообщений: 34523
Нанёс повреждений: 514 ед.
Возраст: 37

Рейтинг



Награды
 
[1 награда]


Цитата:
Дядя Миша писал:
поскольку начнутся проблемы со всякими хлфхами-параноями, вернее всего

Ну разве что ты будешь перестраивать буферы каждый кадр - тогда проблем не будет. Но это может оказаться даже медленнее глбегина.

__________________

Сообщить модератору | | IP: Записан
Сообщение: 100288

Старое сообщение 10-06-2012 19:51
-
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



кстати... мастера... вы программы для тестов от производителей железа используете ?
например Intel GPA ?
http://software.intel.com/ru-ru/blo...2_Intel_GPA.pdf
или аналогичные от АМД или нВидии ?

Сообщить модератору | | IP: Записан
Сообщение: 100291

Старое сообщение 10-06-2012 19:56
- За что?
 Дядя Миша
racing for fish

Дата регистрации: Oct 2005
Проживает: Кубань
Сообщений: 32210
Нанёс повреждений: 392 ед.

Рейтинг



Цитата:
XaeroX писал:
Но это может оказаться даже медленнее глбегина.

я тут кстати подумал. Теоретически можно отрисовку мира сделать на glDrawElements. Но студиомодельки серавно боттлнеком останутся.
Цитата:
underworlddemon писал:
вы программы для тестов от производителей железа используете ?

программы для тестов чего извините? Я движок предпочитаю обкатывать в реальных ситуациях, а не в синтетических тестах.

__________________
My Projects: download page

F.A.Q по XashNT
Блог разработчика в телеграме

Цитата:

C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'

Сообщить модератору | | IP: Записан
Сообщение: 100292

Старое сообщение 10-06-2012 19:59
-
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



Цитата:
Дядя Миша писал:
программы для тестов чего извините? Я движок предпочитаю обкатывать в реальных ситуациях, а не в синтетических тестах.

инструменты для отслеживания узких мест в нагрузке на графику и\или проц

т.е. расширенные мониторинги производительности программ

Сообщить модератору | | IP: Записан
Сообщение: 100295

Старое сообщение 10-06-2012 20:01
- За что?
 XaeroX
Crystice Softworks

Дата регистрации: Oct 2005
Проживает: Торонто
Сообщений: 34523
Нанёс повреждений: 514 ед.
Возраст: 37

Рейтинг



Награды
 
[1 награда]


Цитата:
underworlddemon писал:
инструменты для отслеживания узких мест в нагрузке на графику и\или проц

т.е. расширенные мониторинги производительности программ

Я использую gDEBugger.

__________________

Сообщить модератору | | IP: Записан
Сообщение: 100297

Старое сообщение 10-06-2012 20:13
-
 Дядя Миша
racing for fish

Дата регистрации: Oct 2005
Проживает: Кубань
Сообщений: 32210
Нанёс повреждений: 392 ед.

Рейтинг



Цитата:
underworlddemon писал:
инструменты для отслеживания узких мест в нагрузке на графику и\или проц

т.е. расширенные мониторинги производительности программ

*чешет репу*
да я и так все узкие места знаю. Мониторинг хорош, когда объем кода настолько велик, что не охватывается одним человеком, и с какого-то момента команда перестаёт понимать, что там собственно вообще происходит.

__________________
My Projects: download page

F.A.Q по XashNT
Блог разработчика в телеграме

Цитата:

C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'

Сообщить модератору | | IP: Записан
Сообщение: 100298

Старое сообщение 10-06-2012 20:14
-
underworlddemon
Житель форума
Девойс

Дата регистрации: Jun 2011
Проживает: Россия/Москва
Сообщений: 469
Возраст: 37

Рейтинг



переспрошу по другому:
специализированные инструменты для выявление узких мест в программе (начиная от нагрузки на железо до конкретных функций вызывающих узкие места) используете ?
Intel® Graphics Performance Analyzers
http://software.intel.com/ru-ru/blo...2_Intel_GPA.pdf
AMD Graphics Developer Performance Tools
http://developer.amd.com/assets/Zar...e_Tools_web.pdf
NVIDIA PerfKit
http://developer.nvidia.com/nvidia-perfkit

Добавлено 11-06-2012 в 00:20:

уже ответили =)

проверить не хочется ?

Сообщить модератору | | IP: Записан
Сообщение: 100301

Старое сообщение 10-06-2012 20:20
- За что?
Тема: (Опционально)
Ваш ответ:



Переводчик транслита


[проверить длину сообщения]
Опции: Автоматическое формирование ссылок: автоматически добавлять [url] и [/url] вокруг интернет адресов.
Уведомление по E-Mail: отправить вам уведомление, если кто-то ответил в тему (только для зарегистрированных пользователей).
Отключить смайлики в сообщении: не преобразовывать текстовые смайлики в картинки.
Показать подпись: добавить вашу подпись в конец сообщения (только зарегистрированные пользователи могут иметь подписи).

Временная зона GMT. Текущее время 11:00. Новая тема    Ответить
Страницы (3): « 1 2 [3]   Предыдущая тема   Следующая тема
HLFX.Ru Forum HLFX.Ru Forum > Наш форум > Технические вопросы > BLAS (базовые подпрограммы линейной алгебры)
Версия для печати | Отправить тему по E-Mail | Подписаться на эту тему

Быстрый переход:
Оцените эту тему:

Правила Форума:
Вы not можете создавать новые темы
Вы not можете отвечать в темы
Вы not можете прикреплять вложения
Вы not можете редактировать ваши сообщения
HTML Код ВЫКЛ
vB Код ВКЛ
Смайлики ВКЛ
[IMG] Код ВКЛ
 

< Обратная связь - HLFX.ru >

На основе vBulletin
Авторское право © 2000 - 2002, Jelsoft Enterprises Limited.
Дизайн и программирование: Crystice Softworks © 2005 - 2024