Технология реализации нейросетевого алгоритма в  среде CUDA на примере распознавания рукописных цифр
    Изотов П.Ю., Суханов С.В., Головашкин Д.Л.
   
 
Аннотация:
На примере сверточной нейронной сети  продемонстрированы особенности реализации нейросетевого алгоритма распознавания  образов на видеокарте (GPU) в среде NVIDIA CUDA. Длительность обучения  нейронной сети на видеоадаптере уменьшена в 5,96, а распознавания набора  тестовых образцов – в 8,76 раза по сравнению с оптимизированным алгоритмом,  выполняющим вычисления только на центральном процессоре (CPU). Показана  перспективность реализации нейросетевых алгоритмов на графических процессорах.
Abstract:
On a convolution neural network example features of  implementation of pattern recognition algorithm on Graphic Processing Unit (GPU)  on NVIDIA CUDA are shown. Duration of training of a network on the video  adapter is reduced in 5.96, and recognition of test samples set in 8.76 times  in comparison with the optimised algorithm which uses only central processor  (CPU) for calculations. Perspective  of implementation of such neural network algorithms on graphic processors is  shown.
Ключевые слова
  :
  сверточная нейронная сеть, распознавание образов,  обучение нейронных сетей, метод обратного распространения ошибки, параллельные  вычисления, GPGPU, NVIDIA, CUDA, умножение матриц, CUBLAS.
Key words:
convolutional neural  network, pattern recognition, neural network training, backpropagation of  error, parallel computing, GPGPU, NVIDIA, CUDA, matrices multiplication, CUBLAS.
Литература:
  - Акулов, П.В. Решение задач  прогнозирования с помощью нейронных сетей [Электронный ресурс] // Портал  магистров Донецкого национального технического университета [сайт]. [2006].  URL: http://masters.donntu.edu.ua/2006/fvti/akulov/diss/index.htm (дата обращения: 26.10.2009).
 
- Кульчин, Ю.Н. Нейро-итерационный  алгоритм томографической реконструкции распределенных физических полей в  волоконно-оптических измерительных системах / Ю.Н. Кульчин, Б.С. Ноткин, В.А. Седов  // Компьютерная  оптика. – 2009. – Т. 33,  № 4. – С. 446-455.
 
- Довженко, А.Ю. Параллельная нейронная  сеть с удаленным доступом на базе распределенного кластера ЭВМ: [Текст] / А.Ю. Довженко,  С.А. Крашаков // Тезисы докл. II международн. симп. «Компьютерное обеспечение  химических исследований» (Москва, 22-23 мая 2001 г.) и III Всерос.  школы-конф. по квантовой и вычисл. химии им. В.А. Фока. – С. 52-53.
 
- Fatica, M. CUDA for High Performance Computing  – Materials of HPC-NA Workshop 3, January 2009.
 Belgian  researchers develop desktop supercomputer [Электронный ресурс] // FASTRA  [сайт]. [2008]. URL: http://fastra.ua.ac.be/en/index.html (дата обращения: 28.10.2009).
 
- Stone, J.E. Accelerating  molecular modeling applications with graphics processors / John E. Stone, James  C. Phillips, Peter L. Freddolino, David J. Hardy, Leonardo G. Trabuco, and  Klaus Schulten // Journal of Computational Chemistry, 28:2618-2640, 2007.
 
- New NVIDIA Tesla GPUs Reduce Cost Of Supercomputing By  A Factor Of 10 [Электронный ресурс] // NVIDIA – World Leader in Visual  Computing Technologies [сайт]. [2009]. URL:                    
 http://www.nvidia.com/object/io_1258360868914.html (дата обращения: 20.10.2009).
 
- Simard, P. Best  practices for convolutional neural networks applied to visual document analysis  / Patrice Simard, Dave Steinkraus, and John C. Platt // In Proceedings of ICDAR  2003. – 2003. – P. 958–962.
 
- O'Neill, M. Neural Network for Recognition of Handwritten Digits  [Электронный ресурс] / Mike O'Neill // Codeproject. Free  source code and programming help [сайт]. [2006]. URL:
 http://www.codeproject.com/KB/library/NeuralNetRecognition.aspx (дата обращения: 20.09.2009).
 
- Царегородцев, В.Г. Неисчерпаемы, как  атом (о нейронных сетях и нейропрограммах) [Электронный ресурс] // NeuroPro –  нейросети, анализ данных, прогнозирование и классификация [сайт]. [2008]. URL: http://www.neuropro.ru/memo311.shtml (дата обращения: 20.10.2009).
 
- LeCun, Y. Convolutional  networks for images, speech, and time-series / Y. LeCun and Y. Bengio. In M. A.  Arbib, editor // The Handbook of Brain Theory and Neural Networks, MIT Press,  1995.
 
- Rumelhart, D.E. Learning Internal Representations by Error Propagation / David E. Rumelhart,  G.E. Hinton, R.J. Williams // In Parallel Distributed Processing, Cambridge:  M.I.T. Press, 1986. – V. 1. – P. 318-362.
 
- LeCun, Y. Efficient  BackProp / Y. LeCun, L. Bottou, G. Orr and K. Muller –  Neural Networks: Tricks of the trade, Springer, 1998.
 
- NVIDIA CUDA  Programming Guide Version 2.3.1 [Электронный ресурс] // NVIDIA – World Leader  in Visual Computing Technologies [сайт]. [2009]. URL: http://www.nvidia.com/object/cuda_develop.html (дата обращения: 20.10.2009).
- LeCun, Y. The MNIST database of handwritten digits [Электронный ресурс] // MNIST  handwritten digit database, Yann 
- LeCun and Corinna Cortes [сайт]. [2009]. URL: http://yann.lecun.com/exdb/mnist (дата  обращения: 20.10.2009).
  References:
  - Akulov, P.V. Solving problems of forecasting using neural networks // Master's portal Donetsk National   Technical University.  [2006]. URL:    
 http://masters.donntu.edu.ua/2006/fvti/akulov/diss/index.htm (verified at 10/26/2009). – (in  Russian).
- Kulchin, Yu.N. Neuro-iterative algorithm of  tomographic reconstruction of the distributed physical fields in the fibre-optic  measuring systems / Yu.N. Kulchin, B.S. Notkin, V.A. Sedov // Computer Optics. –  2009. – Т. 33, № 4.  – P. 446-455. – (in Russian).
 
- Dovzhenko, A.Yu. Parallel neural network with remote  access based on a distributed cluster of computers / A.Yu. Dovzhenko, S.A. Krashakov  // Abstracts of II International conference on new techniques and applications  of modern physical chemical methods for environmental studies. – P. 52-53.  – (in Russian).
 
- Fatica,  M. CUDA for High Performance Computing: materials of HPC-NA Workshop 3 (January  2009).
 
- Belgian  researchers develop desktop supercomputer // FASTRA. URL: http://fastra.ua.ac.be/en/index.html (verified  at 10/28/2009).
 
- John  E. Stone, James C. Phillips, Peter L. Freddolino, David J. Hardy, Leonardo G.  Trabuco, and Klaus Schulten. Accelerating molecular modeling applications with  graphics processors. Journal of Computational Chemistry, 28:2618-2640, 2007.
 
- New  NVIDIA Tesla GPUs Reduce Cost Of Supercomputing By A Factor Of 10 // NVIDIA –  World Leader in Visual Computing Technologies. [2009]. URL: http://www.nvidia.com/object/io_1258360868914.html (verified at 10/20/2009).
 
- Patrice  Simard, Dave Steinkraus, and John C. Platt. Best practices for convolutional  neural networks applied to visual document analysis. In Proceedings of ICDAR  2003, pages 958–962, 2003.
 
- Mike  O'Neill. Neural Network for Recognition of Handwritten Digits // Codeproject.  Free source code and programming help. [2006]. URL:     
 http://www.codeproject.com/KB/library/NeuralNetRecog-nition.aspx (verified at 09/20/2009).
 
- Tsaregorodtsev, V.G. Inexhaustible as the atom (about  neural networks and neural applications). [2008]. URL: http://www.neuropro.ru/memo311.shtml (verified at 10/20/2009). – (in Russian).
 
- LeCun, Y., Y. Bengio. Convolutional  networks for images, speech, and time-series. In M. A. Arbib, editor, The  Handbook of Brain Theory and Neural Networks. MIT Press, 1995.
 
- Rumelhart, David E.; Hinton, G.E.;  Williams, R.J. Learning Internal Representations by Error Propagation. In Parallel  Distributed Processing, Cambridge:  M.I.T. Press, v. 1, p. 318-362 (1986).
 
- Y.  LeCun, L. Bottou, G. Orr and K. Muller. Efficient BackProp – Neural Networks:  Tricks of the trade, Springer, 1998.
 
- NVIDIA  CUDA Programming Guide Version 2.3.1 // NVIDIA – World Leader in Visual  Computing Technologies. [2009]. URL:       
 http://www.nvidia.com/object/cuda_develop.html (verified at 20.10.2009).
- Y. LeCun. The MNIST  database of handwritten digits // MNIST handwritten digit database, Yann LeCun  and Corinna Cortes. [2009]. URL: http://yann.lecun.com/exdb/mnist (verified at 10/20/2009).
  
  
  © 2009, ИСОИ РАН
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846 2) 332-56-22, факс: +7 (846 2) 332-56-20