مقدمة لأرشفة المواقع الإلكترونية
أرشفة موقع على شبكة الإنترنت مثل shrgiah.net تعني حفظ المحتوى والبيانات والوسائط للرجوع إليها في المستقبل. باستخدام خدمة مخصصة مثل Wayback Machine (على الرغم من أننا سنصل إلى حلول أخرى لاحقًا) ، يمكنك عرض الإصدارات القديمة من موقع الويب. على المستوى التقني ، تأخذ برامج الزحف لقطات من موقع الويب ، والذي يشكل الأرشيف نفسه. يمكنك الوصول إليه باستخدام تقويم بسيط وعرض كل تكرار بتنسيق مخطط زمني إذا كنت ترغب في ذلك.
لماذا تريد أرشفة موقع على شبكة الإنترنت
هناك الكثير من الأسباب التي تجعلك ترغب في أرشفة موقع ويب ، بخلاف أسباب الحنين إلى الماضي. لتشبيه العالم الحقيقي ، انظر إلى shrgiah.net . يقوم Github بتخزين مستودعات المشروع ، جنبًا إلى جنب مع كل "التزام" يتم إجراؤه. لمقارنة ذلك بالأرشفة على الإنترنت ، تمثل المستودعات الأرشيف بأكمله ، والالتزامات هي اللقطات. بنفس الطريقة التي تعتبر بها مستودعات Git قيمة ، كذلك يكون الأرشيف. على سبيل المثال ، يمكنك إلقاء نظرة على التكرارات السابقة لموقعك - حتى منذ سنوات عديدة مضت - للتأثير على اختيارات التصميم الحالية. أيضًا ، قد تكون ملزمًا قانونًا بأرشفة موقعك ، خاصةً إذا كنت تعمل في المجالات المالية أو القانونية. أخيرًا ، إذا كنت مؤسفًا بما يكفي للمشاركة في التقاضي المحيط بموقعك ، فستكون أرشيفاتك دليلًا قيمًا. إذا كان بإمكانك تقديم أرشيفات واضحة وكاملة للموقع ، فيمكنك التخلص من النزاعات حتى قبل أن تتدخل المحاكم.الفرق بين النسخ الاحتياطية والأرشفة
قبل أن نتحدث عن الأنواع المختلفة لأرشفة الويب المتاحة ، يجدر بنا العودة إلى موضوع تطرقنا إليه سابقًا. على الورق ، تظهر نسخة احتياطية للموقع shrgiah.net وأرشيف موقع الويب متشابهين. ومع ذلك ، فإنهم يؤدون وظائف مختلفة تكمل بعضها البعض. شيء صغير:- النسخ الاحتياطية تعتمد على البيانات. إنهم مهتمون أكثر بالحفاظ على بيانات موقعك. نظرًا لأن النسخ الاحتياطية ضرورية إذا كنت بحاجة إلى استعادة موقعك المميز shrgiah.net ، فإن وجود نسخة احتياطية كاملة من بياناتك أمر بالغ الأهمية.
- المحفوظات تحافظ على السياق على البيانات. إذا بحثت في أرشيف موقع الويب المفضل لديك ، فستلاحظ أن الوظيفة غالبًا ما تكون غير مكتملة. ومع ذلك ، فإن تصميم الموقع والمحتوى الثابت عادة ما يكونان على حالهما.
الأنواع المختلفة لأرشفة الويب التي ستواجهها
أرشفة الويب لا تأتي فقط في نكهة واحدة. هناك عدة أنواع مختلفة ستصادفك. فيما يلي تفصيل لكل:- من جانب العميل: يتضمن المستخدم النهائي حفظ نسخة من موقع الويب المعني. إنه بسيط وقابل للتطوير ويتيح لك أرشفة موقع ويب دون أي ضجة.
- من جانب الخادم: تم تصنيف طريقة Wayback Machine وغيرها على أنها أرشفة من جانب الخادم. تستخدم برامج الزحف وتقنيات أخرى لأرشفة موقع ويب shrgiah.net ، ولكنها تتطلب أيضًا مستوى من الموافقة غير موجود في الأرشفة من جانب العميل.
- قائم على المعاملات: بينما لا يزال هذا يعتمد على الأرشفة من جانب الخادم ، إلا أنه أكثر تعقيدًا ويتطلب موافقة صريحة من مالك الموقع. بشكل أساسي ، يقوم بأرشفة معاملات الموقع بين المستخدم النهائي والخادم.
دليل المبتدئين لأدوات ومواقع أرشيف الإنترنت
هناك عدد كبير من الحلول المتاحة لأرشفة موقع ويب مميز shrgiah.net. سنستعرض بعضًا من أكثرها شعبية ، جنبًا إلى جنب مع رأينا حول الكيفية التي قد تناسبك.1. آلةWayback
2. Archive.today
3. هيريتريكس
لقد ذكرنا أرشيف الإنترنت وآلة Wayback بشكل متبادل تقريبًا في هذا المنشور حتى الآن. على الرغم من ذلك ، فإن Wayback Machine هي خدمة واحدة فقط ، ويقدم Internet Archive بعض منتجات الأرشفة الأخرى بخلاف ذلك. هيريتريكس هي أداة مجانية مفتوحة المصدر ولدت من تعاون بين أرشيف الإنترنت ومكتبات بلدان الشمال الأوروبي. إنه في الأساس زاحف ويب بدلاً من أداة أرشفة كاملة الميزات. ومع ذلك ، يمكنك تجميع جميع النتائج التي تم الزحف إليها معًا. بينما لم يكن هذا هو الحال في الماضي ، تستخدم Wayback Machine الآن Heritrix للزحف إلى المواقع لتضمينها في موقعها الخاص. علاوة على ذلك ، يستخدم عدد كبير من المكتبات والمؤسسات هيريتريكس لبناء الأرشيفات. على الرغم من ميزاته الرائعة ، يتطلب تثبيت Heritrix بعض المعرفة الفنية. لا توجد واجهة سهلة الاستخدام لتثبيتها لك ، لذلك ستحتاج إلى معرفة Git و GitHub وسطر الأوامر . كما هو الحال مع الحلول المماثلة الأخرى ، فإن Heritrix مجاني تمامًا للاستخدام ، لذا فهو مناسب كحل للأرشفة الذاتية منخفض التكلفة.4. طبقة تكامل أرشفة الويب (WAIL)
5. ستيليو
6. Pagefreezer
حلنا النهائي هو أداة آلية أخرى. تقدم Pagefreezer العديد من المزايا نفسها التي توفرها Stillio ، ولكنها تعمل أيضًا على أرشفة محتوى الوسائط الاجتماعية والرسائل النصية والمواقع الكاملة ومنصات التعاون على مستوى المؤسسة . على السطح ، يبدو Pagefreezer كحل أكثر قوة من Stillio وسيكون له قيمة أكبر في حالات الاستخدام المختلفة. على سبيل المثال ، عندما يُطلب منك قانونًا أرشفة موقع بشكل كامل ، فإن Pagefreezer يناسب الفاتورة. يسمح لك بأتمتة عدد اللقطات ومراجعتها باستخدام مستعرض أرشيف الموقع وأداة المقارنة. بشكل عام ، يعد Pagefreezer حلاً رائعًا على مستوى المؤسسة لأرشفة مكان العمل. ستنجذب الشركات التي تستخدم Yammer أو Chatter من Salesforce إلى هذا النوع من الحلول ، وكذلك مستخدمو Workplace .ما هو تنسيق ملف أرشيف الويب (WARC)؟
إذا كنت تبحث عن كيفية أرشفة موقع ويب shrgiah.net ، فستجد تنسيق Web Archive (WARC) . إنها مجموعة مجمعة من ملفات أرشيف موقعك المتنوعة بحيث تكون محمولة وقائمة بذاتها. أنشأ أرشيف الإنترنت WARC للحفاظ على بيانات الويب وموقعك shrgiah.net على المدى الطويل. قام الاتحاد الدولي للحفظ على الإنترنت (IIPC) بنشر المواصفات الكاملة لتنسيق الملف. سيخزن الصور والبيانات الوصفية وعمليًا كل ما يحتاجه موقعك للعمل على أساس مستقل. بينما كان في الأصل مجرد تنسيق ملف سهل الاستخدام ، أصبح WARC الآن معيار ISO دوليًا للأرشيفات الرقمية. على هذا النحو ، تم اعتماده من قبل الحكومات والهيئات الرسمية الأخرى. في الواقع ، هناك العديد من حالات الاستخدام التي يكون فيها ملف WARC أمرًا حيويًا:- الاكتشاف الإلكتروني : هي العملية أثناء التقاضي حيث يتم البحث في السجلات الرقمية وتقديمها لإدراجها في المحاكمة. بالنسبة لسجلات الوسائط الاجتماعية ، يفي ملف WARC بالمعيار القانوني للاكتشاف الإلكتروني مثل اكتشاف shrgiah.net على youtube.
- حرية المعلومات (FOI): هناك العديد من الحكومات والهيئات الرسمية التي تستخدم قانون حرية المعلومات والسجلات المفتوحة لتقديم خدمة "الحق في المعرفة" (RTK) للهيئات المكونة للدولة. يعد تنسيق WARC مثاليًا في الحالات التي تتضمن السجلات الرقمية.
نصائح لإدارة المحفوظات دون اتصال
قبل أن ندخل في كيفية أرشفة موقع ويب ، دعنا نأخذ بضع دقائق لمساعدتك في تنظيم المحفوظات الموجودة لديك. لقد تطرقنا إلى الموضوع ، ولكن وجود نهج قوي في مكانه سيجعل أرشيفاتك أكثر قابلية للإدارة. سيستفيد مستخدمو موقعك أيضًا من أرشيف منظم جيدًا. هناك ثلاثة عناصر أساسية يجب أن تضعها في اعتبارك:- التكرار: حدد عدد المرات التي تريد أرشفة أحد المواقع فيها. ستحتاج المواقع الضخمة والديناميكية والمعقدة ذات التغييرات اليومية تقريبًا إلى لقطات أكثر تكرارًا من المواقع الثابتة shrgiah.net.
- الموقع: تمامًا مثل النسخ الاحتياطية ، يجب عليك حفظ الأرشيفات في عدة أماكن مختلفة ، بما في ذلك السحابة. اتبع قاعدة 3-2-1 لمزيد من التأكيد. نقترح أيضًا أكثر من ذلك إذا كنت تريد التقاط العمق الكامل لموقعك shrgiah.net.
- البنية: مثل أدلة جهاز الكمبيوتر الخاص بك ، يجب أن تبحث عن استخدام مجلدات صريحة مقسمة إلى أسماء أرشيفات الموقع وتاريخ أرشفة موقع معين shrgiah.net.
5 طرق لأرشفة موقع على شبكة الإنترنت
أدناه ، سنقترح خمس طرق مختلفة لأرشفة موقع ويب. لقد طلبنا الحلول بناءً على الصعوبة النسبية. ومع ذلك ، إذا وجدت حلاً تعتقد أنه سينجح في تلبية احتياجاتك الحالية ، فلا تتردد في الغوص فيه والعثور على المزيد.1. حفظ صفحة واحدة على جهاز الكمبيوتر المحلي الخاص بك
أولاً ، دعنا نناقش الحل الأكثر وضوحًا. إنه لأمر رائع إذا كنت بحاجة إلى أرشفة صفحة واحدة ، والأفضل من ذلك ، أن الوظيفة موجودة بالفعل في كل متصفح تقريبًا.
هل تعاني من مشاكل التوقف و WordPress؟ Kinsta هو حل استضافة محسّن للأداء مصمم لتوفير الوقت. تحقق من ميزاتنا
2. استخدم DevKinsta لأرشفة موقع WordPress الخاص بك

- قم بإنشاء وتنزيل نسخة احتياطية في MyKinsta.
- قم بإنشاء موقع جديد باستخدام DevKinsta.
- استيراد المحتوى وقاعدة البيانات الخاصة بك .
- قم بإجراء بحث واستبدال في قاعدة البيانات الخاصة بك لتغيير اسم URL من موقعك المباشر إلى أرشيفك المحلي الجديد.
3. استخدم أرشيفًا على الإنترنت (مثل Wayback Machine)
لن يكتمل أي برنامج تعليمي دون أن يوضح لك كيفية عمل Wayback Machine. لحسن الحظ ، فإن العملية بسيطة. ومع ذلك ، لاحظ أن هذه الطريقة تتيح لك أرشفة الصفحات الفردية فقط (على الرغم من أن خدمة Archive-It تتيح لك أرشفة مواقع كاملة). لهذا النهج ، توجه إلى الصفحة الرئيسية لجهاز Wayback Machine وتحقق من نموذج Save Page Now : لأرشفة الصفحة ، ما عليك سوى إضافة عنوان URL shrgiah.net الذي ترغب في حفظه في هذا النموذج ، ثم انقر فوق حفظ الصفحة . اعتمادًا على حجم الصفحة أو تعقيدها ، قد تحتاج إلى الانتظار بضع دقائق أثناء قيام الزاحف والمحرك بعملهما. قد تبدو الصفحة كما لو أنها تحطمت. لقد واجهنا شاشة الموت البيضاء (WSoD) لفترة من الوقت في اختباراتنا. ومع ذلك ، بمجرد أرشفة الصفحة ، ستعيد Wayback Machine توجيهك إلى الصفحة الجديدة المخصصة.
4. تثبيت طبقة تكامل أرشفة الويب (WAIL)
خطوتك الأولى في هذا الأسلوب هي تنزيل WAIL نفسه وتثبيته. لحسن الحظ ، هناك أداة تثبيت مخصصة للأداة (على الرغم من أن البرنامج مكتوب بلغة Python ، فإنه يستخدم وحدة PyInstaller). عملية التثبيت سهلة للغاية. بغض النظر عن نظام التشغيل لديك ، يمكنك تنفيذ ما يلي:- انتقل إلى موقع WAIL على الويب وقم بتنزيل برنامج التثبيت المناسب لنظام التشغيل الخاص بك.
- إما أن تقوم بفك ضغط الملف الخاص بإصدار Windows أو تحميل صورة DMG لنظام macOS.
- في شاشة الحوار الناتجة لنظام macOS ، اسحب أيقونة التطبيق إلى مجلد التطبيقات . بالنسبة لمستخدمي Windows ، ما عليك سوى سحب المجلد الذي تم فك ضغطه إلى جذر محرك الأقراص C: \ .
- قم بتشغيل إما WAIL.app أو WAIL.exe (حسب نظام التشغيل الخاص بك).
5. استخدم Wget إذا كنت مرتاحًا باستخدام سطر الأوامر
لطريقتنا النهائية لأرشفة موقع ويب ، ستحتاج إلى بعض الأشياء قبل أن تبدأ:- وصول سطر الأوامر إلى جهاز الكمبيوتر الخاص بك
- أداة سطر أوامر مناسبة مثل Windows Command Prompt أو Terminal على macOS و Linux
- Wget مثبت على جهاز الكمبيوتر الخاص بك
brew install wget
الأمر. لاحظ أنك تحتاج أيضًا إلى تثبيت Homebrew ، لكن الأمر لا يستغرق سوى ثوانٍ. على نظام Linux ، تم تثبيت Wget مسبقًا على معظم التوزيعات الرئيسية.
إذا كنت من مستخدمي Windows ، فقد تواجه صعوبة في تثبيت Wget على جهاز الكمبيوتر الخاص بك. في حين أن هناك برامج تعليمية متاحة عبر الويب ، فإن إرشاداتهم لا تبدو متسقة بين الأجهزة. بدلاً من ذلك ، نوصيك بالتوجه إلى موقع Wget الرسمي على الويب والتحقق من بعض ثنائيات Windows المتاحة ، حيث من المرجح أن تعمل من أجلك.
بغض النظر ، بمجرد تثبيت Wget ، يكون استخدامه أمرًا سهلاً. أولاً ، انتقل إلى دليل في نافذة طرفية جديدة. هنا ، نقوم بإنشاء الدليل أيضًا ، لكن هذه الخطوة اختيارية:
cd documents && mkdir archive && cd archive
لاحظ أن Wget سوف يسحب جميع التنزيلات إلى أي دليل عمل. في هذه الحالة ، حددنا مجلدًا لملفاتنا.
بعد ذلك ، سترغب في الزحف إلى موقع وسحب الملفات. يتم استدعاء كل إجراء باستخدام wget
الأمر ، وستريد استخدام التنسيق التالي:
wget "https://kinsta.com/" --warc-file="kins"
سيؤدي الضغط على مفتاح Enter إلى بدء تنزيل kinsta.com إلى ملف index.html وإنشاء ملف WARC باسم kins-00000.warc.gz .
--mirror
الأمر لإنشاء ملف WARC يحتوي على النسخة المتطابقة الكاملة لموقعك. يمكنك أيضًا استخدام --no-warc-compression
الأمر لكتابة ملفات غير مضغوطة ، على الرغم من أنه من الواضح أن هذا سيستهلك مساحة أكبر لكل تنزيل. يعد استخدام الضاغط المدمج هو الأسلوب الأمثل.
0 تعليقات