Автор Тема: Замена Blender Internal? (Прочитано 35238 раз)

sungreen · « **Ответ #15 :** 23 Ноябрь 2012, 23:01:35 »

>>У меня на ЦПУ, а у тебя разве всё быстро?

... вот в теме есть небольшой тест http://blender-3d.ru/forum/index.php/topic,342.msg4896.html#msg4896 ...
... там приводил цифры которые у меня получились ...
на CPU AMD Phenom 4 ядра - 31 мин (30.31:84)
на GPU NVIDIA 460 OpenCL - 13 мин (12.31:23)
на GPU NVIDIA 460 CUDA - 6 мин ( 5.35:37)

... то есть в 5 раз быстрее чем на четырех ядерном ЦПУ ...

Юрий Пет · « **Ответ #16 :** 20 Декабрь 2012, 20:58:36 »

Кстати, на блендернэшнл что то про мех или волосы говорили для Циклов, вроде дополнение (аддон) что ли?
http://www.blendernation.com/2012/12/17/cycles-hair-is-coming/

sungreen · « **Ответ #17 :** 21 Декабрь 2012, 04:48:47 »

>> Кстати, на блендернэшнл что то про мех или волосы говорили для Циклов, вроде дополнение (аддон) что ли?
.. правда что-ли

...
http://blender-3d.ru/forum/index.php/topic,433.msg4969/topicseen.html#msg4969

Юрий Пет · « **Ответ #18 :** 21 Декабрь 2012, 09:36:28 »

Цитата: sungreen от 21 Декабрь 2012, 04:48:47

>> Кстати, на блендернэшнл что то про мех или волосы говорили для Циклов, вроде дополнение (аддон) что ли?
.. правда что-ли ...
http://blender-3d.ru/forum/index.php/topic,433.msg4969/topicseen.html#msg4969

Надо же... конфуз

sungreen · « **Ответ #19 :** 13 Июнь 2013, 06:14:18 »

... Martijn Berger в рассылке bf-cycles@blender.org поделился информацией о проведенных им серии эксперементов, направленных на оптимизацию параметра maxrregcount и в целях снижения времени визуализации ...
... речь идет про видеоплаты NVIDIA для CYCLES_CUDA_BINARIES_ARCH = sm_20 (или sm_21) и версий CUDA 4.2, 5.0, 5.5 ...
... суть - при изменении максимально доступного числа регистров с 24 до 32 можно добиться снижения времени выполнения на 10~15% ...
... собственно, Martijn Berger и предлагает сделать значение этого параметра для sm_20 и sm_21 такое же как и для sm_30 равное 32 ...
... сейчас в кодах Blender это выглядит так ...

Код

#
# CUDA module

if(WITH_CYCLES_CUDA_BINARIES)
	if("${CMAKE_SIZEOF_VOID_P}" EQUAL "8")
		set(CUDA_BITS 64)
	else()
		set(CUDA_BITS 32)
	endif()

	set(cuda_sources kernel.cu ${SRC_HEADERS} ${SRC_SVM_HEADERS} ${SRC_CLOSURE_HEADERS} ${SRC_UTIL_HEADERS})
	set(cuda_cubins)

	foreach(arch ${CYCLES_CUDA_BINARIES_ARCH})
		set(cuda_cubin kernel_${arch}.cubin)

		if(${arch} MATCHES "sm_1[0-9]")
			# sm_1x
			set(cuda_arch_flags "--maxrregcount=24 --opencc-options -OPT:Olimit=0")
		elseif(${arch} MATCHES "sm_2[0-9]")
			# sm_2x
			set(cuda_arch_flags "--maxrregcount=24")
		else()
			# sm_3x
			set(cuda_arch_flags "--maxrregcount=32")
		endif()
		
		add_custom_command(
			OUTPUT ${cuda_cubin}
			COMMAND ${CUDA_NVCC_EXECUTABLE} -arch=${arch} -m${CUDA_BITS} --cubin ${CMAKE_CURRENT_SOURCE_DIR}/kernel.cu -o ${CMAKE_CURRENT_BINARY_DIR}/${cuda_cubin} --ptxas-options="-v" ${cuda_arch_flags} -I${CMAKE_CURRENT_SOURCE_DIR}/../util -I${CMAKE_CURRENT_SOURCE_DIR}/svm -DCCL_NAMESPACE_BEGIN= -DCCL_NAMESPACE_END= -DNVCC
			DEPENDS ${cuda_sources})

		delayed_install("${CMAKE_CURRENT_BINARY_DIR}" "${cuda_cubin}" ${CYCLES_INSTALL_PATH}/lib)
		list(APPEND cuda_cubins ${cuda_cubin})
	endforeach()

	add_custom_target(cycles_kernel_cuda ALL DEPENDS ${cuda_cubins})
endif()

... результаты тестов ...
https://mail.yandex.ru/message_part/CUDA_results.pdf?hid=1.2&ids=2360000002186785530&name=CUDA_results.pdf

sungreen · « **Ответ #20 :** 13 Июнь 2013, 15:37:49 »

... добавлю что у меня лично получилось ...
... если сделать замену set(cuda_arch_flags "--maxrregcount=24")
на set(cuda_arch_flags "--maxrregcount=32") ,
то для уже знакомого теста http://dl.dropbox.com/u/1742071/1m/BMW1M-MikePan.blend при визуализации на видеоплате nvidia gforce 580 время рендеринга снизилось с 52 до 43 секунд, что и составляет эти 15% ...

... в принципе можно рассматривать это как приятный бонус для обладателей карт с sm_20, sm_21 в виде небольшого резерва роста производительности ...

Юрий Пет · « **Ответ #21 :** 13 Июнь 2013, 19:58:00 »

Ссылка нерабочая в предыдущем сообщении на результаты тестов

sungreen · « **Ответ #22 :** 13 Июнь 2013, 20:04:07 »

... тогда выложу файл здесь ...
и
текст сообщения

Цитата: Martijn Berger

I did some benchmarking with 3 versions of the cuda toolkit on my box.

My interpretation of the results is that it could be good to move to cuda 5.0.
But more importantly 24 max registers seems to be sub optimal in the scenes I have tested with.

It could maybe be good to see if the default for sm_21 and sm_20 cards could be moved to 32 as it is for sm_3x currently.

[вложение удалено Администратором]

sungreen · « **Ответ #23 :** 14 Июнь 2013, 20:55:23 »

... очевидно, что тема оптимизации визуализации на этих видеоплатах имеет практический интерес ...
... сегодня Jürgen Herrmann разослал сообщение под заголовком 3 way cuda performance comparison on sm_21 and sm_20 cards ...
... он также опубликовал свои тесты на тему различных windows сборок Blender и сравнил полученные результаты ...
https://r.mail.yandex.net/url/k23q3i--8Sh3lF6-xdOuJA,1371230332/download.shadowrom.de%2FBenchmark%2Epdf

... наиболее интересный вариант c "Optimizations: Cuda optimization patch by Brecht" ...

[вложение удалено Администратором]

sungreen · « **Ответ #24 :** 21 Июнь 2013, 16:56:12 »

... теперь в последних ревизиях blender для версии cuda 5.x штатно установлено --maxrregcount=32 ...
... ожидается небольшой (10~15%) прирост скорости визуализации в cycles на видеоплатах c nvidia c архитектурой sm_2x ...
... вот как это выглядит в коде ...

Код

		set(cuda_version_flags "-D__KERNEL_CUDA_VERSION__=${CUDA_VERSION}")

		# build flags depending on CUDA version and arch
		if(CUDA_VERSION LESS 50)
			# CUDA 4.x
			if(${arch} MATCHES "sm_1[0-9]")
				# sm_1x
				set(cuda_arch_flags "--maxrregcount=24 --opencc-options -OPT:Olimit=0")
			elseif(${arch} MATCHES "sm_2[0-9]")
				# sm_2x
				set(cuda_arch_flags "--maxrregcount=24")
			else()
				# sm_3x
				set(cuda_arch_flags "--maxrregcount=32")
			endif()

			set(cuda_math_flags "")
		else()
			# CUDA 5.x
			if(${arch} MATCHES "sm_1[0-9]")
				# sm_1x
				set(cuda_arch_flags "--maxrregcount=24 --opencc-options -OPT:Olimit=0")
			elseif(${arch} MATCHES "sm_2[0-9]")
				# sm_2x
				set(cuda_arch_flags "--maxrregcount=32")
			else()
				# sm_3x
				set(cuda_arch_flags "--maxrregcount=32")
			endif()

			set(cuda_math_flags "--use_fast_math")
		endif()

... для cuda 4.x максимально доступное число регистров для sm_2x осталовсь 24, будет хорошей идеей перейти на cuda 5.x ...

ps проведенные ранее тесты демонстрировали преимущество cuda 4 перед cuda 5 и очевидно, что работа, проделанная над оптимизацией кода cycles, позволила сегодня утверждать обратное ...
... если выбирать из cuda 4.2 или cuda 5.0 или cuda 5.5, то поряду причин остановился на 5.0 ...

sungreen · « **Ответ #25 :** 22 Январь 2014, 05:08:18 »

Thomas Dinges сообщил об обновлении Cycles standalone.
Направленные на сепарацию Blender и Cycles действия можно попробовать на практике, для построения самостоятоятельной визуализации. Код все еще является экспериментальным, и функционал дорабатывается, но сейчас поддерживается OSL, GPU рендеринг и обмен данными XML.

... по сути где польза - можно запускать Cycles standalone как отдельное приложение, отдавать ему XML сцену и получать готовый результат и можно запускать его из командной строки без графического интерфейса, что облегчает задачи автоматизации процесса визуализации. Также можно в качестве параметров выбрать устройства, на котором (которых) будет осуществлятся расчет сцены, сделать выбор между SVM или OSL и т.п. ...

sungreen · « **Ответ #26 :** 19 Февраль 2014, 05:13:37 »

Thomas Dinges озвучил результаты проверки производительности Blender 2.70 против Blender 2.69

http://temp.dingto.org/Blender270_Cycles_Benchmark.pdf

В целом, выглядит не хуже, за исключением нескольких тестов.

sungreen · « **Ответ #27 :** 21 Февраль 2014, 19:39:58 »

Доступны тестовые сборки Blender 2.70!
сообщение по теме
http://www.blendernation.com/2014/02/21/blender-2-70-test-build-is-now-available/

сами файлы Blender 2.70
http://download.blender.org/release/Blender2.70/

http://www.blendernation.com/wp-content/uploads/2014/02/Cycles_270_Volume-580x396.png

sandman · « **Ответ #28 :** 02 Июнь 2014, 17:21:26 »

Цитировать

Глупо заменять один рендерер другим, бросая его на полпути...

Верно...

sungreen · « **Ответ #29 :** 14 Июнь 2014, 20:53:32 »

Сегодня в группе рассылки bf-cycles было сообщение от Brecht Van Lommel о том что он получил новую работу в Solid Angle, разрабатывающей рендер Arnold и что он больше не в состоянии вносить новые изменения в Cycles. Короче сейчас все говорят ему напутственные слова.

3d форум Blender

Новости:

Автор Тема: Замена Blender Internal? (Прочитано 35238 раз)

sungreen

Re: Замена Blender Internal?

Юрий Пет

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

Юрий Пет

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

Юрий Пет

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

sandman

Re: Замена Blender Internal?

sungreen

Re: Замена Blender Internal?

Яметрика

По форуму

Рекламный блок

Последние вложения