تعیین تعداد سخت افزارهای مورد نیاز جهت استقرار در سایت و جانمائی آنها.
تعیین سرویس های اصلی مورد نیاز و اینکه هر سرویس روی چه ماشینی اجرا شود.
تعیین سرویس های پشتیبان(مانند NTP,LDAP,…).
تعیین منابع مورد نیاز جهت اجرای هر یک از سرویس ها.
تعیین سیاست مدیریت فضای مورد نیاز هر سرویس. تعیین تکنولوژیهای بکار گرفته شده برای مدیریت فضا
(Raw devices, Filesytem Type, LVM, ASM, Snapshot, …).
تعیین تعداد کاربران هر یک از سرویس ها و فضای(Min, Max, Avg) مورد نیاز. تعیین Quota کاربران.
جدا سازی سرویس هائی که میتوان روی ماشین مجازی اجرا نمود از سرویس هائی که باید روی ماشین فیزیکی اجرا نمود.
تعیین سیاست چگونگی اضافه نمودن کاربران جدید به سیستم و همچنین بلاکینگ و حذف کاربرانی که از سیستم کنار گذاشته میشوند.
تعیین تیمهای کاری مرکز داده شامل:
تیم سخت افزار و Storages
تیم Network Backbone
تیم نرم افزارهای پایه(OS, Virtualization, Database, Middleware,…)
تیم Security
نماینده نرم افزارهای کاربردی از هر دپارتمان
تهیه Job Description و مهارتهای لازم مورد نیاز پرسنل مرکز داده اعم از SE و اپراتورها و تعیین نقش هر یک از افراد در تیم.
تعیین سطوح Tierهای مرکز داده جهت Troubleshooting و وظایف هر سطح شامل:
سطح 5: اپراتورها (1-2 سال تجربه)
سطح 4: Junior SE (3-4 سال تجربه)
سطح 3: Senior SE(5-7 سال تجربه)
سطح 2: Head SE(7-9 سال تجربه)
سطح 1: Data Center Operation Manager
تعیین سیاست Task Rotation بین اعضای تیم نرم افزارهای پایه.
تعیین سیاست نام گذاری ها و آدرسها.
تهیه شناسنامه هر یک از ماشینها، سرویس های اجرائی، نحوه پیکربندی هر یک از سرویس ها آن.
تعیین سیاست/مکانیزم Change Management جهت ایجاد تغییرات مورد نیاز. شناسائی سرویسهای جدید مورد نیاز و اینکه روی کدام ماشین فیزیکی/مجازی و کدام بانک اطلاعاتی اجرا شود.
تعیین سیاستها، مکانیزمها و سرویسهای امنیتی.
تعیین سیاست Logging عملیات انجام شده روی هر یک از سیستمها و نحوه آنالیز آن.
تعیین نحوه مانیتورینگ و کنترل سیستم ها.
تعیین سلسله مراتب و نحوه ارتباطات تیم های مرکز داده.
تعیین دامنه کاری بخشهای IT, Core, NOC و نحوه تعامل بین آنها در مرکز داده.
تعیین پراسس های کاری مرکز داده.
تعیین سیاست PM دوره ای کلیه ادوات و ماشینهای موجود.
تعیین سرویس هائی که باید قابلیت Scale out شدن را داشته و روی Cluster پیاده سازی شوند.
تعیین Replication/Clustering در سطح Storage, OS, Database, Middleware.
شناسائی Planned/Unplanned Downtime ها. تعیین ریسکها و نحوه مدیریت آنها. چگونگی تعیین Plan B.
تعیین Downtime قابل تحمل روی هر سرویس اعم از اصلی و پشتیبان که شامل موارد زیر خواهد بود:
تعیین سیاستها/مکانیزمهای Restore و Recovery موثر که Downtime تعیین شده را پوشش دهند.
تعیین سیاستها/مکانیزمهای Backup گیری موثری که 2 مورد فوق را پوشش دهد.
تهیه دستورالعمل جهت Backup/Restore/Recovery.
تعیین سیاست و چگونگی نگهداری از Tape backupها در نقاط فیزیکی مختلف.
تعیین Disaster & Continuity plan.
تعیین چگونگی هماهنگی و سوئیچ سرویس بین سایت اصلی و سایت Disaster.
تست دوره ای Disaster & Continuity plan جهت حصول اطمینان از تداوم کیفیت سرویس.
تست دوره ای کلیه بخش های Data center اعم از HVAC, UPS, Batteries, Genset,…
تست دوره ای کلیه ادوات Redundant مرکز داده و حصول اطمینان از عملکرد آنها.
تست مکانیزم ها امنیتی کلیه بخش های مرکز داده اعم از فیزیکی، الکترونیکی، دیجیتالی.
تعیین سیاست سیستم BSS سازمان و نحوه ارتباط بین سیستم های عملیاتی OLTP با سیستم های تحلیلی/تصمیم یار DSS و همچنین تعیین چرخه زندگی و مدت زمان حضور موثر داده ها در بخش های زیر :
سیستم های عملیاتی
تبدیلات مورد نیاز در ETL (Source-Target Mapping)
انتقال به DW
انتقال به Near Online Storages . انتقال به Magnetic Tape.
حذف از کلیه سیستم ها
تعیین استانداردها و Best practiceهای مرتبط و پایش آنها.
تعیین پروسه ارتقا/Upgrade کردن سیستم ها و Patch زدن روی نرم افزار.
تعیین آموزشهای آتی مورد نیاز جهت ارتقای کیفی پرسنل.
برگزاری جلسات مورد نیاز با Vendor جهت عملیات جاری و آتی.
انطباق سیستم با استاندارهای مرتبط مانند ITIL, CobIT.
نحوه به روز نگهداری مستندات مرتبط با موارد فوق و متولیان آن.
نگارنده: خشایار جام سحر www.jamsahar.com