اسنپ شات چیست؟ راهنمای جامع تکنولوژی Snapshot در مجازی سازی

اسنپ شات چیست؟ راهنمای جامع تکنولوژی Snapshot در مجازی سازی

اسنپ شات چیست و چه کاربردی دارد؟

در دنیای مدیریت زیرساخت‌های فناوری اطلاعات و مجازی‌سازی، مفاهیم بسیاری وجود دارند که علیرغم کاربرد گسترده، اغلب دچار ابهام می‌شوند. یکی از پرتکرارترین و در عین حال حیاتی‌ترین این مفاهیم، Snapshot است. بسیاری از مدیران سیستم تازه کار و حتی برخی از متخصصان با تجربه، اسنپ‌شات را به عنوان یک راهکار پشتیبان‌گیری دائمی تلقی می‌کنند؛ اشتباهی محاسباتی که می‌تواند در زمان وقوع فاجعه، به قیمت از دست رفتن کامل داده‌ها تمام شود.

این مقاله یک بررسی عمیق فنی است. ما قرار نیست صرفا به تعاریف سطحی بپردازیم. هدف این است که مکانیزم‌های سطح پایین دیسک، نحوه مدیریت بلوک‌های داده توسط هایپروایزر (Hypervisor) و معماری دقیق اسنپ‌شات را کالبدشکافی کنیم. اگر به دنبال درک این هستید که چرا اسنپ‌شات دکمه بازگشت به عقب است و نه بیمه عمر داده‌های شما، این مطلب برای شما تدوین شده است.

ماهیت اسنپ شات و مکانیزم عملکرد آن در لایه های زیرین

برای درک عمیق اسنپ‌شات، باید ابتدا دیدگاه سنتی کپی پیست کردن فایل‌ها را کنار بگذارید. اسنپ‌شات در لایه ذخیره‌سازی (Storage) و هایپروایزر، یک کپی کامل از اطلاعات نیست. در واقع، زمانی که شما دستور ایجاد یک اسنپ‌شات را صادر می‌کنید، سیستم بلافاصله تمام گیگابایت‌های داده شما را تکثیر نمی‌کند؛ اگر چنین بود، فرآیند گرفتن اسنپ‌شات ساعت‌ها طول می‌کشید، در حالی که می‌دانیم این پروسه تنها چند ثانیه زمان می‌برد.

اسنپ‌شات در اصل فرآیند فریز کردن وضعیت (State) دیسک مجازی و متادیتاهای آن در یک لحظه خاص از زمان است. بهترین تشبیه برای این تکنولوژی، عکس گرفتن از صحنه تصادف است. زمانی که پلیس از صحنه عکس می‌گیرد، موقعیت ماشین‌ها، خط ترمز و شرایط محیطی در آن لحظه ثبت می‌شود. پس از عکس‌برداری، ماشین‌ها حرکت می‌کنند و جاده تغییر می‌کند، اما آن عکس به عنوان مرجعی از وضعیت گذشته باقی می‌ماند.

در سطح فنی، اسنپ‌شات شامل موارد زیر است:

  • وضعیت دیسک: وضعیت تمامی بلوک‌های داده نوشته شده روی دیسک در لحظه ثبت.
  • وضعیت حافظه (Memory State): اگر گزینه مربوطه فعال شود، محتویات رم ماشین مجازی نیز دامپ می‌شود تا ماشین بتواند دقیقا از همان نقطه پردازشی (بدون نیاز به بوت مجدد) به کار ادامه دهد.
  • متادیتا و پیکربندی: تنظیمات سخت‌افزاری مجازی مانند تعداد هسته‌های پردازنده یا کارت‌های شبکه.

نکته کلیدی اینجاست که اسنپ‌شات به خودی خود حاوی داده نیست، بلکه حاوی نقشه‌ای از داده‌ها در زمان مشخص است. دیسک اصلی ماشین مجازی در حالت فقط خواندنی (Read-Only) قرار می‌گیرد و حیات سیستم به فایلی جدید منتقل می‌شود.

اسنپ شات چیست و چه کاری انجام می دهد؟

تکنولوژی Copy on Write در اسنپ شات و مدیریت فایل های دلتا

قلب تپنده تکنولوژی اسنپ‌شات، مکانیزمی هوشمند به نام Copy on Write یا به اختصار COW است (در برخی سیستم‌ها مانند Storageهای مدرن از Redirect on Write یا ROW استفاده می‌شود که منطقی مشابه اما بهینه تر دارد). بیایید ببینیم دقیقا زیر کاپوت چه اتفاقی می‌افتد.

زمانی که شما یک اسنپ‌شات ایجاد می‌کنید، هایپروایزر (مانند VMware ESXi یا KVM) اقدامات زیر را انجام می‌دهد:

۱. قفل کردن دیسک پایه: دیسک مجازی اصلی (مثلا vm-flat.vmdk) قفل شده و به حالت Read-Only می‌رود. از این لحظه به بعد، هیچ داده جدیدی روی این فایل نوشته نخواهد شد.

۲. ایجاد فایل دلتا (Delta File): یک فایل دیسک جدید و خالی ایجاد می‌شود (مثلا vm-000001.vmdk). این فایل مسئول ذخیره تمامی تغییراتی است که از این لحظه به بعد در سیستم رخ می‌دهد.

مکانیزم نوشتن و خواندن پس از اسنپ شات

  • عملیات نوشتن (Write): وقتی سیستم عامل ماشین مجازی می‌خواهد داده‌ای را تغییر دهد یا فایل جدیدی بنویسد، این داده مستقیما در فایل دلتا نوشته می‌شود. دیسک اصلی دست نخورده باقی می‌ماند.
  • عملیات خواندن (Read): این بخش پیچیده‌تر است. وقتی سیستم عامل درخواست خواندن یک بلوک داده را می‌دهد، هایپروایزر ابتدا فایل دلتا را بررسی می‌کند. اگر داده در فایل دلتا موجود باشد (یعنی بعد از اسنپ‌شات تغییر کرده باشد)، آن را می‌خواند. اگر در دلتا نباشد، به سراغ دیسک پایه می‌رود و داده قدیمی را می‌خواند.

این معماری نشان می‌دهد که چرا اسنپ‌شات‌ها در لحظه ایجاد بسیار سریع هستند اما به مرور زمان می‌توانند کارایی سیستم را کاهش دهند. در واقعیت، ما با زنجیره‌ای از وابستگی‌ها روبرو هستیم. فایل دلتا بدون دیسک پایه کاملا بی‌استفاده و فاقد معنا است، زیرا تنها حاوی تغییرات است و نه کل سیستم عامل.

تفاوت اسنپ شات و بکاپ

تفاوت اسنپ شات و بکاپ؛ بررسی فنی و امنیتی

این بخش مهم‌ترین قسمت برای معماران سیستم و مدیران سرور است. درک تفاوت بین این دو مفهوم، مرز بین بازیابی موفق و فاجعه از دست رفتن داده‌هاست. بسیاری از افراد تصور می‌کنند چون می‌توانند سیستم را با اسنپ‌شات به حالت قبل برگردانند، پس بکاپ دارند. این تصور غلط ناشی از عدم درک ساختار فایل‌سیستم است.

برای شفاف‌سازی دقیق، بیایید به ساختار سرورهای ابری نگاه کنیم. وقتی کاربری می‌پرسد که اصلا سرور مجازی چیست؟ و چگونه کار می‌کند، باید بداند که این سرویس مجموعه‌ای از منابع ایزوله شده روی یک سخت‌افزار فیزیکی است که دیسک‌های آن صرفا فایل‌هایی روی استوریج هستند و اسنپ‌شات‌ها مستقیما روی همین فایل‌های زنده سوار می‌شوند.

تفاوت‌های بنیادین این دو را در جدول زیر بررسی می‌کنیم:

ویژگی اسنپ‌شات (Snapshot) بکاپ (Backup)
وابستگی به منبع کاملا وابسته. اگر دیسک اصلی خراب شود، اسنپ‌شات غیرقابل استفاده است. کاملا مستقل. بکاپ یک نسخه مجزا و کامل است که بدون منبع اصلی هم کار می‌کند.
محل ذخیره‌سازی روی همان Datastore و کنار دیسک اصلی ذخیره می‌شود. معمولا در سرور، دیسک یا فضای ابری جداگانه (Off-site) ذخیره می‌شود.
مکانیزم فنی ثبت تغییرات (Delta) و فریز کردن وضعیت. کپی‌برداری کامل یا افزایشی (Incremental) از کل داده‌ها.
تاثیر بر کارایی با گذشت زمان و رشد فایل دلتا، سرعت دیسک (IOPS) به شدت افت می‌کند. تاثیری بر کارایی سرور در حال اجرا ندارد (مگر در لحظه بکاپ‌گیری).
هدف اصلی بازگشت به عقب کوتاه‌مدت (Versioning) قبل از تغییرات ریسکی. بازیابی فاجعه (Disaster Recovery) و آرشیو طولانی‌مدت.

سناریوی شکست اسنپ شات

فرض کنید استوریج سرور شما دچار خرابی فیزیکی (Corrupt) شود یا فایل سیستم اصلی آسیب ببیند. در این حالت، شما هم دیسک اصلی را از دست داده‌اید و هم فایل‌های دلتا (اسنپ‌شات‌ها) را. اما اگر بکاپ داشته باشید، می‌توانید آن را روی یک سرور کاملا جدید بازگردانی کنید. اسنپ‌شات زنجیره‌ای است که استحکام آن به اندازه استحکام ضعیف‌ترین قطعه سیستم (دیسک اصلی) است.

بهترین سناریوهای کاربردی برای استفاده از اسنپ شات

با وجود تمام هشدارهایی که دادیم، اسنپ‌شات ابزاری بسیار قدرتمند است، به شرطی که در جای درست استفاده شود. این ابزار برای توسعه‌دهندگان (DevOps) و مدیران سیستم (SysAdmins) مانند یک ماشین زمان عمل می‌کند.

موارد زیر بهترین زمان‌ها برای فشردن دکمه اسنپ‌شات هستند:

  • پیش از بروزرسانی‌های سیستمی: قبل از آپدیت کردن کرنل لینوکس، نصب پچ‌های امنیتی ویندوز سرور یا ارتقای سرویس‌هایی مانند Docker و Kubernetes. اگر آپدیت باعث کرش کردن سیستم شد، با یک کلیک به حالت سالم برمی‌گردید.
  • تست کدهای مشکوک و بدافزار: تحلیلگران امنیت سایبری برای بررسی رفتار یک ویروس یا بدافزار، اسنپ‌شات می‌گیرند، ویروس را اجرا می‌کنند و پس از اتمام تحلیل، سرور را به حالت پاک قبل برمی‌گردانند (Revert).
  • تغییرات کانفیگ حساس: زمانی که می‌خواهید تنظیمات شبکه، فایروال یا دیتابیس را تغییر دهید و اطمینان ندارید که این تغییرات چه تاثیری بر سرویس‌دهی خواهد داشت.
  • محیط‌های CI/CD: در پایپ‌لاین‌های توسعه نرم‌افزار، سیستم‌های تست خودکار می‌توانند یک اسنپ‌شات تمیز را لود کنند، تست‌ها را انجام دهند و سپس اسنپ‌شات را حذف کنند تا محیط برای تست بعدی ایزوله بماند.

نکته مهم این است که در تمامی این سناریوها، عمر اسنپ‌شات بسیار کوتاه است؛ از چند دقیقه تا نهایتا چند ساعت.

خطرات نگهداری طولانی مدت اسنپ شات و تاثیر آن بر کارایی

یکی از چالش‌های فنی بزرگ در دیتاسنترها، پدیده‌ای است که به نام زنجیره اسنپ‌شات (Snapshot Chain) یا اسنپ‌شات‌های یتیم شناخته می‌شود. چرا نباید اسنپ‌شات را برای روزها یا هفته‌ها نگه داشت؟ پاسخ در نحوه مدیریت I/O دیسک نهفته است.

مشکل افزایش Latency و کاهش IOPS

همانطور که توضیح دادیم، برای هر عملیات خواندن، هایپروایزر باید بررسی کند که آیا بلوک مورد نظر در فایل دلتا وجود دارد یا خیر. حالا تصور کنید شما چندین اسنپ‌شات پشت سر هم گرفته‌اید (زنجیره‌ای از اسنپ‌شات‌ها).

وقتی سیستم عامل درخواستی برای خواندن یک فایل ارسال می‌کند، هایپروایزر باید:

  1. فایل دلتای ۳ را چک کند.
  2. اگر نبود، فایل دلتای ۲ را چک کند.
  3. اگر نبود، فایل دلتای ۱ را چک کند.
  4. و در نهایت به دیسک اصلی مراجعه کند.

این فرآیند باعث افزایش چشمگیر زمان تاخیر (Latency) می‌شود. هرچه فایل‌های دلتا حجیم‌تر شوند و زنجیره طولانی‌تر باشد، سرور کندتر خواهد شد. در دیتابیس‌های پرترکنش (مانند SQL Server یا MongoDB)، وجود یک اسنپ‌شات قدیمی می‌تواند عملکرد دیتابیس را تا حد غیرقابل استفاده‌ای کاهش دهد.

پر شدن فضای ذخیره سازی

یک تصور غلط این است که اسنپ‌شات جای کمی می‌گیرد. فایل دلتا قابلیت رشد دارد (Growable). اگر شما یک دیسک ۱۰۰ گیگابایتی دارید و روی آن اسنپ‌شات بگیرید، و سپس تمام داده‌های دیسک را تغییر دهید، فایل دلتا نیز می‌تواند تا ۱۰۰ گیگابایت رشد کند. نگه داشتن طولانی مدت اسنپ‌شات می‌تواند باعث پر شدن ناگهانی فضای Datastore و توقف کامل تمام ماشین‌های مجازی شود.

فرآیند دشوار حذف (Consolidation)

وقتی تصمیم می‌گیرید یک اسنپ‌شات قدیمی و حجیم را پاک کنید، هایپروایزر باید تمام داده‌های موجود در فایل دلتا را با دیسک اصلی ادغام (Merge) کند. این عملیات بسیار سنگین است و فشار زیادی به دیسک‌های فیزیکی وارد می‌کند. در برخی موارد، در لحظات پایانی ادغام، ماشین مجازی ممکن است برای چند ثانیه یا حتی چند دقیقه فریز شود (Stun Time) که باعث قطع شدن سرویس‌دهی می‌شود.

توصیه فنی: قانون طلایی این است که عمر اسنپ‌شات نباید از ۲۴ تا ۴۸ ساعت تجاوز کند. پس از اطمینان از صحت تغییرات، بلافاصله اسنپ‌شات را حذف (Commit/Delete) کنید تا تغییرات روی دیسک اصلی تثبیت شود.

کارایی اسنپ شات

اسنپ شات سطح استوریج در برابر اسنپ شات هایپروایزر

تا اینجا صحبت از اسنپ‌شاتی بود که توسط نرم‌افزار مجازی‌ساز (مانند ESXi) گرفته می‌شود. اما در دیتاسنترهای بزرگ که از SAN Storageهای سخت‌افزاری (مانند EMC ،HP یا NetApp) استفاده می‌کنند، تکنولوژی متفاوتی وجود دارد.

چرا اسنپ‌شات سخت‌افزاری بهتر است؟ وقتی شما در لایه VMware اسنپ‌شات می‌گیرید، سربار (Overhead) پردازشی روی سرور و فایل‌های دلتا ایجاد می‌شود. اما اسنپ‌شات سطح استوریج (Storage Level Snapshot) مستقیما توسط کنترلر دستگاه ذخیره‌ساز انجام می‌شود.

  • مزیت اصلی: این روش تقریبا هیچ فشاری به سرور مجازی با قابلیت snapshot وارد نمی‌کند. عملیات توسط آرایه‌های دیسک انجام می‌شود و حتی می‌توان هزاران اسنپ‌شات را بدون افت سرعت نگه داشت.
  • کاربرد: برای بکاپ‌گیری‌های ساعتی از دیتابیس‌های بسیار حجیم و حیاتی، معمولا از ترکیب راهکارهای نرم‌افزاری (مانند Veeam) با اسنپ‌شات سخت‌افزاری استفاده می‌کنند تا کمترین شوک (Stun) به سیستم وارد شود.

خطای Consolidation Needed و چالش حذف اسنپ شات ها

یکی از ترسناک‌ترین پیام‌هایی که یک ادمین مجازی‌سازی با آن مواجه می‌شود، خطای Virtual Machine disks consolidation is needed است. این اتفاق زمانی رخ می‌دهد که فرآیند حذف اسنپ‌شات به درستی انجام نشده است.

چرا این اتفاق می‌افتد؟

زمانی که شما دکمه «Delete All Snapshots» را می‌زنید، سیستم باید داده‌های فایل دلتا را به دیسک اصلی منتقل کند. اگر در حین این عملیات:

  • سرعت تغییرات دیتا (Data Change Rate) روی سرور بیشتر از سرعت نوشتن دیسک باشد
  • ارتباط استوریج برای لحظه‌ای قطع شود
  • فایل‌های بکاپ توسط نرم‌افزار دیگری قفل شده باشند (File Lock)

عملیات شکست می‌خورد. در این حالت فایل‌های دلتا باقی می‌مانند اما در مدیریت اسنپ‌شات دیده نمی‌شوند.

راه حل فنی

در این شرایط هرگز نباید فایل‌ها را دستی از روی Datastore پاک کنید. راهکار صحیح استفاده از گزینه Consolidate در منوی هایپروایزر است که تلاش می‌کند مجددا فایل‌های out of date شده را با دیسک اصلی یکپارچه کند. در موارد حادتر، ممکن است نیاز باشد ماشین مجازی خاموش شود تا قفل فایل‌ها آزاد شده و عملیات ادغام انجام گیرد.

جمع بندی

تکنولوژی اسنپ‌شات یکی از کارآمدترین ابزارها در جعبه‌ابزار مجازی‌سازی است که چابکی و امنیت عملیاتی را در لحظات حساس فراهم می‌کند. اما درک این نکته حیاتی است که اسنپ‌شات ابزاری برای مدیریت نسخه (Versioning) است، نه حفاظت از داده (Data Protection).

تکیه بر اسنپ‌شات به عنوان استراتژی بکاپ، مانند رانندگی بدون کمربند ایمنی است؛ شاید تا مدتی مشکلی پیش نیاید، اما در لحظه حادثه هیچ محافظتی از شما نخواهد کرد. برای حفظ سلامت و کارایی سرورهای خود، همواره اسنپ‌شات‌ها را تنها برای بازه‌های زمانی کوتاه ایجاد کنید و بلافاصله پس از اتمام تست یا بروزرسانی، آن‌ها را حذف نمایید تا از افت کارایی و مشکلات پیچیده ذخیره‌سازی جلوگیری کنید. با رعایت این اصول فنی، می‌توانید از قدرت واقعی مجازی‌سازی بدون به خطر انداختن پایداری زیرساخت بهره‌مند شوید.

سوالات متداول

01آیا می‌توان از اسنپ شات به عنوان جایگزین بکاپ استفاده کرد؟

خیر، این بزرگترین اشتباهی است که می‌توان انجام داد. اسنپ‌شات برای عملکرد خود کاملا به دیسک اصلی (Base Disk) وابسته است. اگر دیسک اصلی به هر دلیلی دچار خرابی فایل سیستم شود یا استوریج آسیب ببیند، تمام اسنپ‌شات‌های وابسته به آن نیز از بین می‌روند. بکاپ باید یک نسخه مستقل و جداگانه باشد.

02آیا گرفتن اسنپ شات سرعت سرور را کاهش می‌دهد؟

در لحظه ایجاد اسنپ‌شات خیر، اما نگهداری آن در طولانی مدت بله. به دلیل مکانیزم Copy on Write، هر بار که سرور می‌خواهد اطلاعاتی را بخواند، باید بین فایل‌های دلتا و دیسک اصلی جستجو کند. هرچه اسنپ‌شات قدیمی‌تر و فایل دلتا بزرگ‌تر باشد، تاخیر (Latency) دیسک بیشتر شده و کارایی سرور افت می‌کند.

03حداکثر چه مدت باید یک اسنپ شات را نگه داریم؟

استاندارد جهانی و توصیه شرکت‌هایی مانند VMware این است که عمر اسنپ‌شات نباید از ۲۴ تا ۷۲ ساعت بیشتر شود. اسنپ‌شات برای تست‌های موقت طراحی شده است، نه نگهداری دائمی داده‌ها.

04آیا هنگام حذف اسنپ شات اطلاعاتی که بعد از آن اضافه کرده‌ایم پاک می‌شود؟

خیر. اصطلاح حذف اسنپ‌شات (Delete Snapshot) در واقع به معنای ادغام یا Commit کردن است. وقتی شما اسنپ‌شاتی را پاک می‌کنید، سیستم تمام تغییرات ذخیره شده در فایل دلتا را به دیسک اصلی منتقل می‌کند و سپس فایل دلتا را دور می‌ریزد. بنابراین آخرین وضعیت اطلاعات شما حفظ می‌شود و فقط نقطه بازگشت به عقب پاک می‌شود.

05تفاوت اسنپ شات Quiesced با اسنپ شات معمولی چیست؟

اسنپ‌شات معمولی (Crash Consistent) فقط وضعیت دیسک را فریز می‌کند و ممکن است دیتابیس‌های در حال اجرا را دچار مشکل کند. اما اسنپ‌شات Quiesced (Application Consistent) با کمک ابزارهایی مثل VMware Tools ابتدا دیتابیس‌ها و فایل سیستم را از طریق رم هماهنگ می‌کند و سپس اقدام به گرفتن عکس می‌کند که برای سرورهای دیتابیس بسیار حیاتی است.

06آیا می‌توان روی سرور روشن اسنپ شات گرفت؟

بله. تکنولوژی‌های مدرن مجازی‌سازی اجازه می‌دهند بدون هیچ‌گونه خاموشی یا اختلال در سرویس‌دهی (Downtime)، از ماشین مجازی روشن اسنپ‌شات بگیرید. حتی وضعیت رم سیستم نیز قابل ذخیره‌سازی است.

نظرات کاربران

شما میتوانید دیدگاه خود را در مورد این مطلب با ما با اشتراک بگذارید.

logo
ثبت نام ناحیه کاربری راهنمای خرید پرداخت قسطی
ناحیه کاربری
ثبت نامناحیه کاربریداشبورد ابریارسال تیکتتماس تلفنی
تماس با ما
مشاوره تلفنی 1779 | 79625000
واحد مارکتینگ داخلی 1
واحد مشتریان داخلی 2
مالی و اداری داخلی 3
منابع انسانی داخلی 4