Обзор работ научной школы В. А. Якубовича по искусственному интеллекту и робототехнике

Авторы

  • Алексей Серафимович Матвеев Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7–9
  • Александр Львович Фрадков Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7–9
  • Александр Иванович Шепелявый Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7–9

DOI:

https://doi.org/10.21638/spbu01.2023.406

Аннотация

В статье представлен обзор работ научной школы В. А. Якубовича в области искусственного интеллекта, машинного обучения, адаптивных систем и робототехники. Подробно рассмотрен метод рекуррентных целевых неравенств. Раскрыто значение представленных результатов для развития кибернетики и искусственного интеллекта. Особое внимание уделено основополагающим работам В. А.Якубовича в области распознавания образов и развитию концепции конечно-сходящихся алгоритмов решения рекуррентных целевых неравенств; в качестве конкретной иллюстрации подробно обсуждаются типичные результаты о сходимости таких алгоритмов. Освещается вклад школы в становление и дальнейшую разработку современной теории адаптивных систем управления и математической робототехники, в частности теории адаптивных роботов. Отдельный раздел посвящен вопросам адаптивного субоптимального управления.

Ключевые слова:

искусственный интеллект, машинное обучение, адаптивные системы, робототехника, кафедра теоретической кибернетики СПбГУ, история науки

Скачивания

Данные скачивания пока недоступны.
 

Библиографические ссылки

Литература

1. Фрадков А. Л. Научная школа по теоретической кибернетике В. А. Якубовича в Санкт-Петербургском (Ленинградском) университете. В: История информатики и кибернетики в Санкт-Петербурге (Ленинграде). Юсупов Р. М. (ред.), 79-83 (2008).

2. Fradkov A. L., Shepeljavyi A. I. The History Story of Cybernetics and Arti cial Intelligence. A View From Saint Petersburg. Cybernetics and Physics 11 (4), 253-263 (2022).

3. Gusev S. V., Bondarko V. A. Notes on Yakubovich's method of recursive objective inequalities and its application in adaptive control and robotics. IFAC Congress on Automatic Control. Berlin, July, 12-17 (2020).

4. Fradkov A. L. Early History of Machine Learning. IFAC Congress on Automatic Control. Berlin, July,12-17 (2020).

5. Annaswamy A. M., Fradkov A. L. A Historical Perspective of Adaptive Control and Learning. Annual Reviews in Control 52, 18-41 (2021). https://doi.org/10.48550/arXiv.2108.11336

6. Fradkov A. L., Polyak B. T. Adaptive and Robust Control in the USSR. IFAC-PapersOnLine 53 (2), 1373-1378 (2020). https://doi.org/10.1016/j.ifacol.2020.12.1882

7. Якубович В. А. Машины, обучающиеся распознаванию образов. В: Методы вычислений. Ленинград, Изд-во ЛГУ. Вып. 2, 95-131 (1963).

8. Якубович В. А. Машины, обучающиеся распознаванию образов. Ч. I, II. Вестник Санкт-Петербургского университета. Математика. Механика. Астрономия I, 8 (66), вып. 4, 625-638 (2021). https://doi.org/10.21638/spbu01.2021.408; II, 9 (67), вып. 1, 94-112 (2022). https://doi.org/10.21638/spbu01.2022.110

9. Якубович В. А. Некоторые общие теоретические принципы построения обучаемых опознающих систем. I. Вычислительная техника и вопросы программирования. Ленинград, Изд-во ЛГУ, (1965). 3-71.

10. Якубович В. А. Рекуррентные конечно-сходящиеся алгорифмы решения систем неравенств. Доклады академии наук 166 (6), 1308-1312 (1966).

11. Якубович В. А. К теории адаптивных систем. ДАН СССР 182 (3), 518-522 (1968)

12. Якубович В. А. Адаптивные системы с многошаговыми целевыми условиями. ДАН СССР 183 (2), 303-306 (1968).

13. Гелиг А. Х., Якубович В. А. Применение обучаемой опознающей системы для выделения сигнала из шума. Вычислительная техника и вопросы кибернетики 5, 95-100 (1968).

14. Якубович В. А. Об одной задаче самообучения целесообразному поведению. Автоматика и телемеханика 8, 119-139 (1969).

15. Якубович В. А. Об организации "мозга" одного класса систем, вырабатывающих целесообразное поведение (решенные и нерешенные задачи). 4-я Всесоюзная конференция по нейрокибернетике: рефераты докладов 152, Ростов, Изд-во Ростовского университета (1970).

16. Пенев Г. Д., Якубович В. А. О некоторых задачах адаптивного управления. ДАН СССР 198 (4), 787-790 (1971).

17. Якубович В. А., Тимофеев А. В. Об одном классе самообучающихся систем, обладающих целесообразным поведением. В: Управление и информационный процесс в живой природе 111-113. Москва, Наука (1971).

18. Тимофеев А. В., Харичев В. В., Шмидт А. А., Якубович В. А. Одна задача распознавания и описания изображений. Биологическая, медицинcкая кибернетическа и бионика. Киев: Изд-во Научного совета по кибернетике и Института кибернетики (1971).

19. Гусев С. В., Тимофеев А. В., Якубович В. А. Адаптация в робототехнических системах с искусственным интеллектом. VII Всесоюзное совещание по проблемам управления: тезисы докладов. Минск, 279-282 (1977).

20. Вапник В. Н. Машины, обучающиеся распознаванию образов. В: Алгоритмы обучения распознаванию образов. Москва, Советское радио 5-24 (1973).

21. Козинец Б. Н., Ланцман Р. М., Якубович В. А. Криминалистическая экспертиза близких почерков при помощи электронно-вычислительных машин. ДАН СССР 167, 1008-1011 (1966).

22. Козинец Б. Н. Об одном алгорифме обучения линейного персептрона. Вычислительная техника и вопросы программирования 3, 80-83 (1964).

23. Митчелл Б. Ф., Демьянов В. Ф., Малоземов В. Н. Нахождение ближайшей к началу координат точки многогранника. Вестник Ленинградского университета. Сер. 1 19, 38-45 (1971)

24. Mitchel B. F., Dem'yanov V. V., Malozemov V. N. Finding the point of a polyhedron closest to the origin. SIAM J. Control 12 (1), 19-26 (1974).

25. Малоземов В. Н. МДМ-методу - 40 лет. Вестник Сыктывкарского ун-та 15, 51-62 (2012).

26. Вапник В. Н., Червоненкис А. Я. Об одном классе перцептронов. Автоматика и телемеханика 25 (1), 112-120 (1964).

27. Якубович В. А. Конечно-сходящиеся алгорифмы решения счетных систем неравенств и их применение в задачах синтеза адаптивных систем. ДАН СССР 169 (3), 495-498 (1969).

28. Фомин В. Н. Стохастические аналоги конечно-сходящихся алгоритмов обучения опознающих систем. Вычислительная техника и вопросы программирования 6, 68-87 (1971).

29. Фрадков А. Л. Некоторые конечно-сходящиеся алгоритмы решения бесконечных систем неравенств и их применение в теории адаптивных систем. Вестник Ленинградского университета. Сер. 1 19, 70-75 (1972).

30. Фомин В. Н. Математическая теория обучаемых опознающих систем. Ленинград, Издво ЛГУ (1976).

31. Деревицкий Д. П., Фрадков А. Л. Прикладная теория дискретных адаптивных систем управления. Москва, Наука (1981).

32. Bondarko V. A., Yakubovich V. A. The Method of Recursive aim Inequalities in Adaptive Control Theory. Int. J. Adaptive Control and Signal Proc. 6, 141-160 (1992).

33. Фрадков А. Л. Адаптивное управление сложными системами. Москва, Наука (1990).

34. Гусев С. В. Конечно-сходящийся алгоритм восстановления функции регрессии и его применение в задачах адаптивного управления. Автоматика и телемеханика 3, 79-85 (1989).

35. Бондарко В. А. Адаптивные субоптимальные системы с переменной размерностью вектора подстраиваемых параметров. Автоматика и телемеханика 11, 38-59 (2006).

36. Гусев С. В., Тимофеев А. В., Якубович В. А. Об одной иерархической системе управления интегральным роботом. Труды VI объединенной конференции по искусственному интеллекту 76-85. Москва, Институт проблем управления (1975).

37. Григорьев Г. Г., Гусев С. В., Нестеров В. В., Якубович В. А. Адаптивное управление мобильным роботом-манипулятором. Всесоюзная научно-техническая конференция "Адаптивные роботы-82": тезисы докладов 89-91 (1982).

38. Тимофеев А. В. Роботы и искусственный интеллект. Москва, Наука (1978).

39. Фомин В. Н., Фрадков А. Л., Якубович В. А. Адаптивное управление динамическими объектами. Москва, Наука (1981).

40. Гелиг А. Х. Динамика импульсных систем и нейронных сетей. Ленинград, Изд-во ЛГУ (1982).

41. Грановская Р. М., Березная И. Я. Интуиция и искусственный интеллект. Ленинград, Изд-во ЛГУ (1991).

42. Savkin A. V., Cheng T. M., Xi Z., Javed F., Matveev A. S., Hguyen H. Decentralized Coverage Control Problems for Mobile Robotic Sensor and Actuator Networks. IEEE Press and John Wiley and Sons, New Yor, Hoboken (2015).

43. Matveev A. S., Savkin A. V., Hoy M. C., Wang C. Safe Robot Navigation among Moving and Steady Obstacles. Elsevier and Butterworth Heinemann. Oxford (2016).

44. Hoy M., Matveev A. S., Savkin A. V. Algorithms for collision-free navigation of mobile robots in complex cluttered environments: A surve Robotica 33 (3), 463-497 (2015).

45. Якубович В. А. Адаптивное субоптимальное управление линейным динамическим объектом при наличии запаздывания в управлении. Кибернетика 1, 26-43 (1976).

46. Бондарко В. А., Якубович В. А. Синтез субоптимальной адаптивной системы с эталонной моделью для управления дискретным линейным динамическим объектом. В сб.: Адаптация и обучение в системах управления и принятия решений 10-27, Новосибирск, Наука (1982).

47. Lewis F., Vrabie D. Reinforcement learning and adaptive dynamic programming for feedback control. IEEE Circ. Syst. Magazine 9 (3), 32-50 (2009).

48. Lewis F., Vrabie D., Vamvoudakis K. G. Reinforcement Learning and Feedback Control: Using Natural Decision Methods to Design Optimal Adaptive Controllers. IEEE Circ. Syst. Magazine 32 (6), 30 (2012).

49. Sutton R. S., Barto A. G., Williams R. J. Reinforcement learning is direct adaptive optimal control. IEEE Control Systems Magazine 12 (2), 19-22 (1992).

50. Yang X., Liu D., Wang D. Reinforcement learning for adaptive optimal control of unknown continuous-time nonlinear systems with input constraints. International Journal of Control 87 (3), 553- 566 (2014).

51. Recht B. A Tour of Reinforcement Learning: The View from Continuous Control. Annu. Rev. Control Robot. Auton. Syst. 2, 253-279 (2019).

52. Bian B. T., Jiang Z.-P. Value iteration, adaptive dynamic programming, and optimal control of nonlinear systems. IEEE 55th Conf. on Decision and Control. IEEE Trans. Neur. Net and Learning Systems (2021).

53. Lipkovich M. Yakubovich's method of recursive objective inequalities in machine learning. IFAC-PapersOnLine 55 (12), 138-143 (2022).

References

1. Fradkov A. L. Scientific School of Theoretical Cybernetics at St. Petersburg (Leningrad) University. In: The History of Computer Science and Cybernetics in St. Petersburg (Leningrad). Yusupov R. M. (еd.), 79-83 (2008). (In Russian)

2. Fradkov A. L., Shepeljavyi A. I. The History Story of Cybernetics and Artificial Intelligence. A View From Saint Petersburg. Cybernetics and Physics 11 (4), 253-263 (2022).

3. Gusev S.V., Bondarko V.A. Notes on Yakubovich’s method of recursive objective inequalities and its application in adaptive control and robotics. IFAC Congress on Automatic Control. Berlin, July, 12-17 (2020).

4. Fradkov A. L. Early History of Machine Learning. IFAC Congress on Automatic Control. Berlin, July,12-17 (2020).

5. Annaswamy A.M., Fradkov A. L. A Historical Perspective of Adaptive Control and Learning. Annual Reviews in Control 52, 18-41 (2021). https://doi.org/10.48550/arXiv.2108.11336

6. Fradkov A. L., Polyak B. T. Adaptive and Robust Control in the USSR. IFAC-PapersOnLine 53 (2), 1373-1378 (2020). https://doi.org/10.1016/j.ifacol.2020.12.1882

7. Yakubovich V. A. Machines learning pattern recognition. In: Metody vychislenii 2, 95-131, Leningrad, University Press (1963). (In Russian)

8. Yakubovich V. A. Machines learning pattern recognition. Р. I, II Vestnik of Saint Petersburg University. Mathematics. Mechanics. Astronomy I, 8 (66) iss. 4, 625-638 (2021) https://doi.org/10.21638/spbu01.2021.408; II, 9 (67) iss 1, 94-112 (2022). https://doi.org/10.21638/spbu01.2022.110 (In Russian) [Engl. trans.: Yakubovich V.A. Vestnik St. Petersburg University, Mathematics Р. I, 54 iss. 4, 384-394 (2021); https://doi.org/10.1134/S1063454122010150; II, 55, iss. 1, 326-336 (2022) https://doi.org/10.1134/S1063454120030048].

9. Yakubovich V.A. Some general theoretical principles of the construction of trainable identification systems. I. Vychislitel’naia tekhnika i voprosy programmirovaniia 3-71. Leningrad, Leningrad University Press (1965). (In Russian)

10. Yakubovich V.A. Recurrent finitely convergent algorithms for solving systems of inequalities. Doklady Akademii nauk SSSR 166 (6), 1308-1312 (1966). (In Russian)

11. Yakubovich V.A. Theory of adaptive systems. Soviet Physics Doklady 182 (3), 518-522 (1968) (In Russian) [Engl. trans.: Soviet Physics Doklady 13 (9), 852-856 (1968)].

12. Yakubovic V.A. Adaptive systems with multistep goal conditions. Doklady Akademii nauk SSSR 183 (2), 303-306 (1968). (In Russian)

13. Gelig A. Kh., Yakubovich V. A. Application of a trainable recognition system to isolate a signal from noise. Vychislitel’naia tekhnika i voprosy kibernetiki 95-100, Leningrad, Leningrad University Press, (1968). (In Russian)

14. Yakubovich V.A. About one task of self-learning appropriate behavior. Avtomatika i telemekhanika 8, 119-139 (1969). (In Russian)

15. Yakubovich V.A. About the organization of “brain” of one class of systems that develop appropriate behavior (solved and unsolved problems). 4th All-Union Conference on Neurocybernetics: Аbstracts of reports, Rostov University Publ. (1970). (In Russian)

16. Penev G. D., Yakubovich V.A. About some tasks of adaptive behavior. Doklady Akademii nauk SSSR 198 (4), 787-790 (1971). (In Russian)

17. Yakubovich V.A., Timofeev A.V. Upravlenie I informatsyonnyi protses v schyvoi prirode Doklady Akademii nauk SSSR 111-113. Moscow, Naukа Publ. (1971). (In Russian)

18. Timofeev A. V., Kharichev V. V., Shmidt A.A., Yakubovich V. A. One task of image recognition and description. Biological, medical cybernetics and bionics. Kyiv, Nauchnyi sovet po kibernetike i Institut po kibernetike Publ., 1971. (In Russian)

19. Gusev C.V., Timofeev A.V., Yakubovich V.A. Adaptation in robotic systems with artificial intelligence. VII All-Union Meeting on Control Problems. Abstracts of reports 279-282, Minsk, (1977). (In Russian)

20. Vapnik V.N. Machines learnnig pattern recognition. In: Pattern Recognition Learning Algorithms 5-24. Moscow, Sovetskoe Radio Publ. (1973). (In Russian)

21. Kozinets B.N., Lantsman R.M., Yakubovich V.A. Forensic examination of close handwriting using electronic computers. Doklady Akademii nauk SSSR 167, 1008-1011 (1966). (In Russian)

22. Kozinets B.N. About a linear perceptron learning algorithm. Vychislitel’naia tekhnika i voprosy programmirovaniia 3, 8-83 (1964). (In Russian).

23. Mitchel B. F., Dem’yanov V.V., Malozemov V.N. Finding the point closest to the origin of the polyhedron. Vestnik Leningrad University, 19, 38-45 (1971). (In Russian)

24. Mitchel B. F., Dem’yanov V.V., Malozemov V.N. Finding the point of a polyhedron closest to the origin. SIAM J. Control 12 (1), 19-26 (1974).

25. Malozemov V.N. MDM method after 40 years. Vestnik Syktyvkarskogo instituta 15, 51-62 (2012). (In Russian)

26. Vapnik V.N., Chervonenkis A.Ya. About one class of perceptrons. Avtomatika i telemekhanika 25 (1), 112-120 (1964). (In Russian)

27. Yakubovich V.A. Finitely convergent algorithms for the solution of countable systems of inequalities and their applications in problems of the synthesis of adaptive systems. Doklady Akademii nauk SSSR 169 (3), 495-498 (1969). (In Russian) [Engl. trans.: Soviet Physics. Doklady 14 (11), 1051-1054 (1970)].

28. Fomin V.N. Stochastic analogs of finitely convergent learning algorithms for recognition systems. In: Vychislitel’naia tekhnika i voprosy programmirovaniia, 6 68-87. (1971). (In Russian)

29. Fradkov A. L. Some finitely converging solution algorithms for infinite systems of inequalities and their application in the theory of adaptive systems. Vestnik Leningrad University Mathematics 5, 378-385 (1978). (In Russian)

30. Fomin V.N. Mathematical theory of trainable recognition systems. Leningrad, Leningrad University Press, (1976). (In Russian)

31. Derevitskij D.P., Fradkov A. L. Applied theory of discrete adaptive control systems. Moscow, Nauka Publ. (1981). (In Russian)

32. Bondarko V.A., Yakubovich V. A. The Method of Recursive aim Inequalities in Adaptive Control Theory. Int. J. Adaptive Control and Signal Proc. 6, 141-160 (1992).

33. Fradkov A. L. Adaptive control of complex systems. Moscow, Nauka Publ. (1990). (In Russian)

34. Gusev S.V. A finite convergent algorithm for restoring the regression function and its use in adaptive control problems. Avtomatika i telemekhanika 3, 79-85 (1989). (In Russian) [Engl. trans.: Autom. Remote Control 50 (3) 367-374 (1989)].

35. Bondarko V.A. Adaptive suboptimal systems with a variable dimension of the vector of adjustable parameters. Avtomatika i telemekhanika 11, 38-59 (2006). (In Russian) [Engl. trans.: Autom. Remote Control 67 (11) 1732-1751 (2006)].

36. Gusev S.V., Timofeev A.V., Yakubovich V.A. On a hierarchical system of integral robot control. In: Proc. of the 4th International Joint Conference on Artificial Intelligence 9, 53-61 (1975). Moscow, Institut Problem upravleniia Publ. (In Russian)

37. Grigor’ev G.G., Gusev S.V., Nesterov V.V., Yakubovich V.A. Mobile robot-manipulator adaptive control. In Proc. of the Soviet Conference “Adaptive Robots” 89-91. (1982). (In Russian)

38. Timofeev A.V. Robots and artificial intelligence. Moscow, Nauka Publ. (1978). (In Russian)

39. Fomin V. N., Fradkov A. L., Yakubovich V.A. Adaptive control of dynamic systems. Moscow, Nauka Publ. (1981). (In Russian)

40. Gelig A.Kh. Dynamics of impulse systems and neural networks. Leningrad, Leningrad University Press (1982). (In Russian)

41. Granovskaya R.M. Intuition and artificial intelligence. Leningrad, Leningrad University Press (1991). (In Russian)

42. Savkin A.V., Cheng T.M., Xi Z., Javed F., Matveev A. S., Hguyen H. Decentralized Coverage Control Problems for Mobile Robotic Sensor and Actuator Networks. IEEE Press and John Wiley and Sons, New York, Hoboken (2015).

43. Matveev A. S., Savkin A.V., Hoy M.C., Wang C. Safe Robot Navigation among Moving and Steady Obstacles. Elsevier and Butterworth Heinemann. Oxford (2016).

44. Hoy M., Matveev A. S., Savkin A.V. Algorithms for collision-free navigation of mobile robots in complex cluttered environments: A surve Robotica 33 (3), 463-497 (2015)

45. Yakubovich V.A. Adaptive suboptimal control of a linear dynamic object in the presence of a delay in control. Kibernetika 1, 26-41 (1976). (In Russian)

46. Bondarko V.A., Yakubovich V.A. Synthesis of a suboptimal adaptive system with a reference model for controlling a discrete linear dynamic object. In: Adaptation and training in control and decision-making systems 10-27. Novosibirsk, Nauka Publ. (1982). (In Russian)

47. Lewis F., Vrabie D. Reinforcement learning and adaptive dynamic programming for feedback control. IEEE Circ. Syst. Magazine 9 (3), 32-50 (2009).

48. Lewis F., Vrabie D., Vamvoudakis K.G. Reinforcement Learning and Feedback Control: Using Natural Decision Methods to Design Optimal Adaptive Controllers. IEEE Circ. Syst. Magazine 32 (6), 30 (2012).

49. Sutton R. S., Barto A.G., Williams R. J. Reinforcement learning is direct adaptive optimal control. IEEE Control Systems Magazine 12 (2), 9-22 (1992).

50. Yang X., Liu D., Wang D. Reinforcement learning for adaptive optimal control of unknown continuous-time nonlinear systems with input constraints. International Journal of Control 87 (3), 553-566 (2014).

51. Recht B. A Tour of Reinforcement Learning: The View from Continuous Control. Annu. Rev. Control Robot. Auton. Syst. 2, 253-279 (2019).

52. Bian B.T., Jiang Z.-P. Value iteration, adaptive dynamic programming, and optimal control of nonlinear systems. IEEE 55th Conf. on Decision and Control. IEEE Trans. Neur. Net and Learning Systems (2021).

53. Lipkovich M. Yakubovich’s method of recursive objective inequalities in machine learning. IFAC-PapersOnLine 55 (12), 138-143, 2022.

Загрузки

Опубликован

23.12.2023

Как цитировать

Матвеев, А. С., Фрадков, А. Л., & Шепелявый, А. И. (2023). Обзор работ научной школы В. А. Якубовича по искусственному интеллекту и робототехнике. Вестник Санкт-Петербургского университета. Математика. Механика. Астрономия, 10(4), 665–685. https://doi.org/10.21638/spbu01.2023.406

Выпуск

Раздел

К 300-летию СПбГУ

Наиболее читаемые статьи этого автора (авторов)