هوش مصنوعی

پردازش تصویر پیشرفته با شبکه‌های عصبی کانولوشنی (CNN)

دکتر علی احمدی۱۴۰۲/۸/۲۴
پردازش تصویر پیشرفته با شبکه‌های عصبی کانولوشنی (CNN)

شبکه‌های عصبی کانولوشنی (CNN) انقلابی در حوزه بینایی ماشین ایجاد کرده‌اند. این شبکه‌ها با الهام از قشر بینایی مغز انسان، قادر به استخراج ویژگی‌های پیچیده از تصاویر هستند.

معماری یک CNN

یک CNN استاندارد از چند لایه اصلی تشکیل شده است:

  1. لایه کانولوشن: برای استخراج ویژگی‌ها (لبه‌ها، بافت‌ها).
  2. لایه Pooling: برای کاهش ابعاد و پیچیدگی.
  3. لایه Fully Connected: برای دسته‌بندی نهایی.

در اینجا یک قطعه کد Python با استفاده از کتابخانه TensorFlow/Keras برای ساخت یک CNN ساده آورده شده است:

import tensorflow as tf
from tensorflow.keras import layers, models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))

model.summary()