پایگاه دادهها (بهطور خلاصه، «پایگاه»)، بانک اطلاعاتی، دادِگان یا دِیتابِیس (به انگلیسی: Database) به مجموعهای از دادهها با ساختار منظم و سامانمند گفته میشود.
اصطلاحات و بررسی اجمالیبعبارت دیگر، «پایگاه داده» اشاره به مجموعهای از دادههای مرتبط و ساختار یا سازمان است که دسترسی به این اطلاعات معمولاً از طریق «سیستم مدیریت پایگاه داده» (DBMS) متشکل از یک مجموعه یکپارچه از نرمافزارهای کامپیوتری است که اجازه میدهد تا کاربران برای ارتباط برقرار کردن با یک یا چند پایگاه دادهها و دسترسی به تمام اطلاعات موجود در پایگاه داده (اگر چه محدودیت ممکن است که دسترسی محدود به اطلاعات خاص وجود داشته باشد) را فراهم میکند. چگونگی این که توابع مختلف که ورود، ذخیرهسازی و بازیابی مقادیر زیادی از اطلاعات و همچنین ارائه برای مدیریت را نشان میدهد که این اطلاعات سازمان یافته است. از آنجا که از ارتباط نزدیک بین آنها، اصطلاح «پایگاه داده» است که اغلب معمولی استفاده میشود برای اشاره به هر دو یک پایگاه داده و DBMS استفاده میشود. خارج از دنیای فناوری اطلاعات حرفهای، پایگاه داده مدتی است که اغلب برای اشاره به هر مجموعهای از دادههای مرتبط (مانند یک صفحه گسترده یا یک شاخص کارت) استفاده میشود. در این مقاله تنها با پایگاه دادهای که در آن اندازه و شرایط ضروری استفاده از سیستم مدیریت پایگاه داده مهم است سروکار داریم. دی.بی.ام.اس. اس موجود به توابع مختلف اجازه میدهد که مدیریت یک پایگاه داده و دادههای خود را انجام دهد که میتوان آن را به چهار گروه اصلی طبقهبندی کرد:
تعریف دادهها - ایجاد، اصلاح و حذف از تعاریف که سازمان داده را با استفاده از آن تعریف میکنیم.به روز رسانی - درج، اصلاح و حذف دادههای واقعی.ارائه اطلاعات در یک فرم به طور مستقیم قابل استفاده یا برای پردازش بیشتر توسط برنامههای کاربردی دیگر. دادههای بازیابی ممکن است در یک فرم اساساً همان است که در پایگاه داده یا در یک فرم جدید به دست آمده با تغییر یا ترکیب دادههای موجود از پایگاه دادههای ذخیره شده در دسترس ساخته شده است.اداره - ثبت نام و نظارت بر کاربران، اجرای امنیت دادهها، نظارت بر عملکرد، حفظ تمامیت دادهها، خرید و فروش با کنترل همزمانی، و دوره نقاهت بعد اطلاعات است که توسط برخی از رویداد مانند شکست غیرمنتظره سیستم خراب به وجود میآید.هم پایگاه داده و همDBMS مطابق با اصول مدل پایگاه داده خاص است. «سیستم پایگاه داده» اشاره جمعی به مدل پایگاه داده، سیستم مدیریت پایگاه داده، و پایگاه داده است. از لحاظ فیزیکی، سرورهای پایگاه داده کامپیوتر اختصاص داده شده است به برگزاری پایگاههای داده واقعی و اجرا تنها DBMS و نرمافزارهای مرتبط است. سرورهای پایگاه داده معمولاً از چند کامپیوتر، با حافظه و دیسک RAID مورد استفاده برای ذخیرهسازی پایدار است..RAID ابرای بازیابی دادهها استفاده میشود اگر هر کدام از دیسکها و یا. سختافزار شتاب دهنده پایگاه داده، از طریق یک کانال با سرعت بالا به یک یا چند سرویس دهنده متصل شود، در محیطهای پردازش تراکنش با حجم زیادی استفاده میشوند.. دی.بی.ام. اس در قلب اکثر برنامههای کاربردی پایگاه داده یافت میشود. دی.بی.ام. اس ممکن است در اطراف یک هسته چند وظیفه سفارشی ساخته شده برای حمایت از شبکه ساخته شده است، اما دی.بی.ام.اس. اس مدرن به طور معمول در یک سیستم عامل استاندارد وجود دارد. دی.بی.ام.اس. اس شامل یک بازار اقتصادی قابل توجه برای فروشندگان کامپیوتر و ذخیرهسازی الزامات DBMS در برنامههای توسعه داده است. پایگاه دادهها و دی.بی.ام.اس. اس را میتوان با توجه به مدل پایگاه داده (بازدید کنندگان) که آنها را پشتیبانی میکند (مانند رابطه یا XML)، نوع (بازدید کنندگان) کامپیوترهایی که آنها را اجرا میکند (از یک خوشه سرور به یک تلفن همراه) طبقهبندی کرد.
تاریخچه پایگاه دادهمفهوم پایگاه دادهمفهوم پایگاه داده از دههٔ ۱۹۶۰ برای کاهش مشکلات فزاینده در طراحی، ساخت، و نگهداشت سسیستمهای اطلاعاتی (معمولاً با تعداد زیادی کاربرِ نهایی همزمان، و با تعداد زیادی دادهٔ مختلف) ایجاد شدهاست. این مفهوم به همراه مفهوم سیستمهای مدیریت پایگاه داده که دستکاری مؤثر و کارا به پایگاه دادهها را ممکن میکند رشد کردهاست.
اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ بازمیگردد، یعنی زمانی که شرکت System Development Corporation مسئولیت اجرایی یک طرح به نام «توسعه و مدیریت محاسباتی یک پایگاه دادهای مرکزی» را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰ در اروپا و در اواخر دهه ۷۰ در خبر نامههای معتبر آمریکایی به کار رفت. (بانک دادهای یا در اوایل سال ۱۹۶۶ در روزنامه واشینگتن پست کار رفت)
اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز بکمن میباشد. مقالات بکمن این را نشان داد که فرضیات او کاربرد بسیار مؤثرتری برای دسترسی به وسایل ذخیرهسازی را مهیا میکند. در آن زمانها پردازش داده بر پایه کارتهای منگنه و نوارهای مغناطیسی بود که پردازش سری اطلاعات را مهیا میکند. دو نوع مدل دادهای در آن زمانها ایجاد شد:CODASYL موجب توسعه مدل شبکهای شدکه ریشه در نظریات بکمن داشت و مدل سلسله مراتبی که توسط North American Rockwell ایجاد شد و بعداً با اقتباس از آن شرکت IBMمحصولIMS را تولید نمود.
مدل رابطهای توسط E. F. Codd در سال ۱۹۷۰ ارائه شد. او مدلهای موجود را مورد انتقاد قرار میداد. برای مدتی نسبتاً طولانی این مدل در مجامع علمی مورد تأیید بود. اولین محصول موفق برای میکرو کامپیوترها dBASE بودکه برای سیستمعاملهایCP/M و PC-DOS/MS-DOS ساخته شد. در جریان سال ۱۹۸۰ پژوهش بر روی پایگاههای مدل توزیع شده و ماشینهای پایگاهی (database machines) متمرکز شد، اما تأثیر کمی بر بازار گذاشت. در سال ۱۹۹۰ توجهات به طرف مدل شیء گرا جلب شد. این مدل جهت کنترل دادههای مرکب لازم بود و بهسادگی بر روی پایگاه دادههای خاص، مهندسی داده (شامل مهندسی نرمافزار منابع) و دادههای چند رسانهای کار میکرد.
در سال ۲۰۰۰ نوآوری تازهای رخ داد و پایگاه اکسامال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و دادهها است و کمک میکند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند.
نرمافزارپایگاه دادهها برای حمایت از عملیات داخلی سازمانها و زیر بنای تعامل آنلاین با مشتریان و تأمین کنندگان (نرمافزار شرکت مراجعه کنید). استفاده میشود. پایگاه دادهها برای نگهداری اطلاعات اداری و اطلاعات تخصصی تر، مانند دادههای مهندسی یا مدلهای اقتصادی استفاده میشود. نمونههایی از برنامههای کاربردی پایگاه داده شامل سیستم کتابخانه کامپیوتری، سیستم رزرو پرواز و سیستمهای موجودی computerizedparts.
توضیح دی.بی.ام. اسDBMS به یک سیستم نرمافزار پیچیده تکامل یافته است و توسعه آن به طور معمول به هزاران نفر و سال تلاش وتوسعه نیاز دارد. برخی از دی.بی.ام. اس مانند Adabas، اوراکل و DB2. هدف دی.بی.ام. اس رفع نیازهای برنامههای کاربردی. با این حال، این واقعیت است که هزینه توسعه میتواند مقرون به صرفه تر باشد. با این حال، DBMS همیشه راه حل بهینهای دارد: در برخی مواردDBMS ممکن سربار غیر ضروری را معرفی کند. نمونههای بسیاری از سیستمهای که با استفاده از پایگاه دادههای خاص وجود دارد. یک مثال رایج سیستم ایمیل است: سیستمهای ایمیل طراحی شده است برای بهینهسازی مدیریت پیامهای ایمیل، و نیازی بخش قابل توجهی از قابلیت DBMS است. بسیاری از بانکهای اطلاعاتی نرمافزار برنامهای است برای دسترسی به پایگاه داده از طرف کاربران نهایی، بدون قرار دادن رابط DBMS به طور مستقیم. برنامه نویسان نرمافزار ممکن است یک پروتکل سیم به طور مستقیم، یا به احتمال زیاد از طریق یک رابط برنامهنویسی برنامه استفاده کنند. طراحان پایگاه داده و مدیران پایگاه داده با DBMS از طریق رابطهای اختصاص داده شده برای ساخت و حفظ برنامههای کاربردی پایگاههای داده، و در نتیجه نیاز به برخی از دانش بیشتر و درک در مورد چگونگی عملکرد دی.بی.ام. اس و رابط خارجی و پارامترهای تنظیم دی.بی.ام. اس تعامل میکنند.
فهرست مطالب:
فصل اول: مفاهیم پایگاه داده ها
سیستم ذخیره و بازیابی اطلاعات در معنای عام
ردههای تکنولوژیکی سیستم مدیریت پایگاه دادهها
داده
تعریف اطلاع
تعریف دانش
تعریف پایگاه دادهها
مراحل کلی کار در مشی فایلینگ
معایب مشی فایلینگ
مراحل کلی کار در مشی پایگاهی
عناصر محیط پایگاه دادهها
انواع سختافزارهای محیط پایگاه داده
انواع نرمافزارهای موجود در محیط پایگاه دادهها
فصل دوم: مدلسازی معنایی داده ها
مدلسازی معنایی دادهها
انواع روشهای مدلسازی معنایی دادهها
سه مفهوم معنایی موجود در روش ER
تعریف موجودیت
سه ضابطه در رابطه با تشخیص یک نوع موجودیت
موجودیت مستقل و وابسته
تعریف صفت
انواع صفت و تعاریف هریک
ارتباط
خصوصیات نوع ارتباط
نمودار ER
نمادهای رسم نمودار ER
وضع مشارکت در ارتباط
درجه آن ارتباط
چندی یا ماهیت نوع ارتباط
فصل سوم: محدودیت های روش ER
مشکلات روش ER (سه نوع دام)
تجزیه و ترکیب
تخصیص و تعمیم
تجمع
وراثت صفت
دسته بندی
مراحل مدلسازی معنایی دادهها
روش مدلسازی UML
نمادها
خصوصیات کلی روش مدلسازی معنایی داده ها
فصل چهارم: پایگاه داده در محیط انتزاعی
پایگاه دادهها در محیط انتزاعی
سطوح محیط انتزاعی
گونههای موجود ساختار دادهای
مفهوم ساختار دادهای در سطوح مختلف پایگاه دادهها
ساختار دادهای رابطهای
شمای پایگاه جدولی
عملیات در پایگاه جدولی
عملگرهای جبر رابطهای
برخی ویژگیهای ساختار دادهای جدولی
ساختار دادهای سلسلهمراتبی
برخی ویژگیهای ساختار دادهای سلسلهمراتبی
ساختار دادهای شبکهای
مجموعه کوداسیل
برخی ویژگیهای ساختار دادهای شبکهای
فصل پنجم: معماری پایگاه داده ها
معماری پشنهادی ANSI
دید ادراکی (مفهومی)
دید خارجی
دید داخلی
سطوح معماری در محیط ناپایگاهی و محیط پایگاهی و نقش DBMS در ایجاد، مدیریت و پردازش فایلها
کاربر
زبان میزبان
نقش افزایش تعداد زبانهای میزبان مورد پذیرش DBMS
زبان دادهای فرعی
دستورهای DSL برای سه سطح معماری پایگاه دادهها
تقسیمبندی زبان دادهای فرعی از نظر نیاز به زبان میزبان
روند کلی مرحله کامپایل برنامه دوزبانی
ویژگیهای زبان دادهای فرعی
فصل ششم: سیستم مدیریت پایگاه داده ها
سیستم مدیریت پایگاه دادهها DBMS
DBMS به کاربر امکان میدهد تا رده بندی سیستمهای DBMS از نظرهای مختلف
اجزای DBMS از نمای بیرونی
نمای بیرونی (سادهشده) DBMS
اجزای DBMS از نمای درونی
واحدهای لایه هسته
واحدهای لایه مدیریت محیط پایگاه دادهها
ساختار یک سیستم پایگاهی
فصل هفتم: DBMS در یک سیستم کامپیوتری
جایگاه DBMS در یک سیستم کامپیوتری
سه طرح کاربرد DBMS در برنامههای کاربردی
اسلوبهای عملیاتی
کاتالوگ سیستم و دیکشنری دادهها: متا دادهها
اطلاعاتی که در دیکشنری دادهها نگهداری میشود
دیکشنری دادهها و استفادهکنندگان آن
پارامترهای شناخت DBMS
مدیر پایگاه دادهها
برخی مسئولیتهای در تیم مدیریت پایگاه دادهها
پنج سرمایه در مدیریت نوین سازمانها
مزایا و معایب تکنولوژی پایگاه دادهها
مزایا و معایب سیستم تک کاربری
مزایا و معایب سیستم چند کاربری
شرایط استفاده از تکنولوژی پایگاه دادهها
کاربردهای جدید تکنولوژی پایگاه دادهها
استقلال دادهای و انواع آن
فصل هشتم: معماری سیستم پایگاه داده ها
معماری سیستم پایگاه دادهها
انواع معماری
معماری متمرکز
معماری مشتری - خدمتگزار
طرحهای معماری مشتری - خدمتگزار
مزایای معماری مشتری – خدمتگزار در مقایسه با معماری متمرکز
معماری توزیع شده
ویژگیهای معماری توزیع شده
مزایا و معایب معماری توزیع شده
معماری با پردازش موازی
طرح های معماری با پردازش موازی
معماری سیستم چندپایگاهی
معماری سیستم پایگاههای همراه
فصل نهم: مدل رابطه ای
مفاهیم اساسی مدل رابطهای
بخشهای اساسی مدل دادهای
تعریف رابطه
تناظر بین مفاهیم رابطه ای و مفاهیم جدولی
ویژگیهای رابطه
انواع رابطه
میدان (دامنه)
مزایای میدان
رابطه نرمال و غیر نرمال
دلیل لزوم نرمال بودن رابطه
معایب رابطه نرمال
مزایا و معایب رابطه غیرنرمال
انواع کلید در مدل رابطه ای
فصل دهم: قواعد جامعیت پایگاه داده ها
جامعیت پایگاه دادهها
عوامل نقض جامعیت
انواع قواعد جامعیت
قواعد کاربری و انواع آن
متاقواعد و انواع آن
راههای اعمال قواعد جامعیت
عملگرهای جبر رابطهای
کاربردهای جبر رابطهای
حساب رابطهای
مزایا و معایب مدل رابطهای
کاتالوگ در مدل رابطهای
اشیائی که اطلاعات آنها در کاتالوگ نگهداری میشود
فصل یازدهم: زبان SQL
انواع زبانهای رابطه ای
امکانات مهم زبان SQL
دستورات تعریف داده ها، دستور ایجاد و حذف جدول و دید
دستور مجازشماری
دستورات پردازش داده ها
توابع جمعی (گروهی)
امکان LIKE و NOTLIKE
آزمون تست وجود هیچ مقدار در یک ستون
امکان UNION و UNION ALL
امکان GROUP BY: (گروهبندی)
امکان HAVING
امکان BETWEEN
دستورات عملیات ذخیرهسازی (درج، حذف و بهنگام سازی)
جمعبندی در مورد امکانات نسخه SQL1
دستوراتی که در نسخه SQL2 تغییر کردند یا به آن اضافه شدند
امکانات جامعیتی
امکانات ایمنی
امتیازها
دستوراتی که در نسخه SQL3 تغییر کردند یا به آن اضافه شدند
نوع داده مجرد
تعریف رهانا و مزایا و موارد کاربرد آن
تراکنش
طرحهای اجرای تراکنشها
تکنیکهای کنترل همروندی
فصل دوازدهم: دید در مدل رابطه ای
دیدهای رابطهای
دید در SQL
مزایا و معایب دید
عملیات در دیدهای رابطهای
انواع دید از نظر پذیرش عملیات ذخیره سازی
انواع دیدهای پذیرا
انواع دیدهای ناپذیرا
ویژگیهای دیدهای قابل بهنگام سازی
فصل سیزدهم: طراحی پایگاه داده های رابطه ای
مراحل طراحی پایگاه دادهها
نمودار مراحل اساسی طراحی پایگاه دادهها
روشهای طراحی منطقی پایگاه دادهها
روش طراحی بالا به پایین
روش سنتز رابطهای
روش ترکیبی
خصوصیات طراحی خوب
چهارده روش تبدیل نمودار ER به رابطهها
فصل چهاردهم: نرمال تر سازی رابطه ها
آنومالی در عملیات ذخیرهسازی
صورتهای نرمال
وابستگی تابعی
وابستگی تابعی نامهم (بدیهی)
قواعد استنتاج آرمسترانگ
مجموعه کاهش ناپذیر وابستگیهای تابعی
وابستگی تابعی تام (کامل)
رابطه 1NF
رابطه 2NF
رابطه 3NF
صورت نرمال بایس-کاد
وابستگی تابعی چندمقداری
رابطه 4NF
وابستگی تابعی چندمقداری ادغام شده
رابطه 5NF
مزایا و معایب نرمال تر سازی
انواع افزونگی در پایگاه دادهها
فصل پانزدهم: طراحی فیزیکی پایگاه داده ها
تحلیل عوامل
تحلیل پرسشها
تحلیل تراکنشها
تصمیمات در طراحی فیزیکی
اهداف تنظیم پایگاه دادهها
اطلاعات لازم در تنظیم پایگاه دادهها
مسائل مطرح در تنظیم
نکات قابل توجه در بازبینی طراحی منطقی پایگاه دادهها پس از عملیاتی شدن آن
کارهای لازم برای اصلاح شاخصهای ایجاد شده در مرحله تنظیم پایگاه دادهها