Андрій Полухін - Machine Learning Engineer у Data Science UA. Основними сферами інтересів Адрія є дослідження Deep Learning архітектур, методи тренування глибинних мереж, інтуїція та математичні теореми, що стоять за цим, взяємодія AI із навколишнім світом.
Чи замислювались ви, що особливого у нейронних мережах, наприклад, MobileNetV3, FBNet, BlazeFace, які знаходяться в таких повсякденних для нас речах як телефон або телевізор?
Основна їх складність, але разом з тим інтерес до них, в ефективній побудові нейромережі для малопотужних пристроїв.
Протягом цієї лекції поговоримо про те:
- яка інтуїція стоять за створенням таких шарів як Fire module, Squeeze-and-Excitation;
- як оптимально вибрати кількість параметрів моделі, а також ширину та глибину шарів архітектури, наприклад, алгоритми EfficientNet або Model Rubik’s Cube;
- які SOTA рішення дозволять пришвидшити та оптимізувати деякі шари вашої нейромережі.
Ця доповідь буде цікава для тих, хто хотів б дізнатись, як побудувати ефективну та маленьку нейромережу.
#machinelearning #ai #artificialintelligence #bigdata #deeplearning #technology #datascience #tech #iot #robotics #blockchain #coding #programming #innovation #startup #entrepreneur #developer #ml #business #computervision #cryptocurrency #python #computerscience #singularity #data #science #motivation #art #leadership #algorithm
Негізгі бет Андрій Полухін "Lightweight Neural Network Architectures"
Пікірлер