فایل های صوتی

مقدمه ای در باب فایل های صوتی

صدا همان جنبش ملکول‌هاست. و در اثر برخورد با یکدیگر از یک نقطه به نقطه دیگر منتقل می‌شود.

فرکانس: تعداد موج در ثانیه است. واحد آن هرتز (Hz) است.

فرکانس صدا (زیر / بم)

  • بم: فرکانس کم (صدای طبل)
  • زیر: فرکانس زیاد (صدای پرندگان)

محدوده شنوایی و تولید صدا

به طور متوسط، گوش انسان می‌تواند صداهایی را با فرکانس های بین ۲۰ تا ۲۰۰۰۰ هرتز تشخیص دهد. صدایی با فرکانس‌های کمتر از محدوده شنوایی انسان را اینفراسوند (infrasound) و صدایی با فرکانس‌های بالاتر را اولتراسوند (ultrasound) می‌نامند . انسان همچنین می‌تواند از راه دهان صدا تولید کند. بازه فرکانس‌هایی که انسان می‌تواند تولید کند از ۸۵ هرتز تا ۱۱۰۰ هرتز است.

در نمودار زیر می توانید بازه شنوایی و تولید صدای چند حیوان را ببینید.

بسیاری از حیوانات می‌توانند صداهای خارج از بازه شنوایی انسان را تولید کنند و یا بشنوند.

بلندی: قدرت ارتعاش (دسی‌بل)

بلندی صدای بیش از 80dB می تواند صدمات غیر قابل بازگشت به گوش انسان وارد سازد.

ضبط صدا

توماس ادیسون در سال ۱۸۷۷ اولین فونوگراف را ساخت.

روش‌های ضبط صدا

    • آنالوگ: روی صفحات گرامافون یا نوار کاست ضبط می‌شوند،
      شکل امواج صدا را دقیقا ثبت می‌کنند.

    • دیجیتال: روی حافظه‌های دیجیتال ذخیره می‌شوند،
      سطح انرژی صوتی را در پریودهای زمانی مساوی ثبت می‌کنند.

نرخ نمونه‌گیری Sample rates

نرخ نمونه‌گیری: تعداد دفعات نمونه‌گیری از امواج صوتی در ثانیه است.(هرتز)

قالب نمونه‌گیری Sample format

قالب نمونه‌گیری: تعداد بیت برای ثبت هر نمونه.

ذخیره سازی

  • فایل‌های صوتی می‌توانند بسیار بزرگ شوند.
  • فشرده سازی برای تسهیل در نگهداری و جابجایی
  • روش‌های فشرده‌سازی فایل صدا:
    • کاهنده کیفیت (Lossy): mp3, acc, ogg
    • غیر کاهنده کیفیت (Lossless): wav, flac, and alac

عوامل کاهش کیفیت

  • تنظیم نادرست ورودی(clipping)
  • نرخ نمونه‌گیری پایین
  • قالب نمونه‌گیری پایین
  • فشرده سازی زیاد