РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ — МСХА ИМ. К. А. ТИМЕРЯЗЕВА
Реферат на тему:
База данных. База знаний. Банк данных
Выполнила студентка 101 группы
Факультета Садоводства и
ландшафтной архитектуры
Мазурова А. А.
Москва 2013
В силу все более широкого распространения персональных компьютеров важность организации информации в виде баз данных и баз знаний непрерывно возрастает.
Наше время трудно представить жизнь и работы средних и крупных предприятий без информационных систем, а в основу информационных систем входит базы данных и конечно система управления ими. Основным принципом организации базы данных является совместное хранение данных и их описаний.
Цель курсовой работы — выявление сущности понятий базы данных и базы знаний.
В первой главе данной курсовой работы рассматривается база данных, основные ее понятия, классификация, система управления базами данных — представлены функции, структура и основные характеристики СУБД, также описывается типы данных, их безопасность, и для каких целей предназначены база данных.
Вторая глава посвящена базам знаний, их сущности, даны основные понятия, классификация, система управления базами знаний и для каких целей они предназначены. Показано, чем базы данных отличается от базы знаний. Так же приведены модели представления знаний, при помощи которых строятся экспертные системы.
1.1 Базы данных и системы управления базами данных
База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.
Организованная человеком совокупность данных во внешней памяти компьютера, предназначенная для длительного хранения и постоянного использования, называется базой данных. База данных представляет собой совокупность наборов данных. Объединение информации в базу данных это уже информационная модель некоторого объекта. Она используется при обработке информации об этом объекте.
Организуется так, что данные собираются однажды и централизованно хранятся в виде, доступном всем специалистам или системам программирования, которые могут их использовать. Особенности организации данных в Базе данных обеспечивают использование одних и тех же данных в различных приложениях, позволяют решать различные задачи планирования, исследования и управления.
Проектирование базы данных «Автосалон»
... База данных 1.1 Понятия о базах данных и системах управления ими Информационная система Цель любой информационной системы - обработка информации конкретной предметной области. Под предметной областью понимается совокупность ... Access. Удаленная база данных Программа работы с удаленной базой данных состоит из ... Целью разработки автоматизированной системы «Автосалон», является упрощение процедуры поиска ...
Базы данных сводят к минимуму дублирование данных, прибегая к дублированию только для ускорения доступа к данным или для обеспечения восстановления базы данных при ее разрушении.
Одна из важных черт Базы данных — независимость данных от особенностей программ прикладных, которые ее используют, а также возможность создания этих программ в такой форме, что изменение особенностей хранения, логической структуры или значений данных не требует изменения программ их обработки.
Другой важной чертой Базы данных является возможность изменения физических особенностей хранения данных без изменения их логической структуры. Функционирование Базы данных обеспечивается совокупностью языковых и программных средств, называемых системой управления базами данных (СУБД).
Системы управления базами данных обеспечивают:
- Определение данных, подлежащих хранению в Базе данных (определение логических свойств данных, соответствующих представлениям пользователя и называемых структурами данных в Базе данных, а так же физическая организация хранения данных, называемая структурами хранения Базы данных);
- Первоначальную загрузку данных в Базу данных — так называемое создание Базы данных;
- Обновление данных;
- Доступ к данным по различным запросам пользователя, отбор и извлечение некоторой части Базы данных, редактирование извлеченных данных и выдачу их пользователю.
Перечисленные действия принято называть процессом получения справок из Базы данных. Специальные средства СУБД Система Управления Базами Данныхобеспечивают секретность данных и их целостность — защиту от непредсказуемого взаимодействия конкурентных процессов, приводящих к случайному или преднамеренному разрушению данных, а также от отказов оборудования.
Важным аспектом Базы данных, обусловливающим спектр возможных использований, является допустимый в ней класс структур данных, задаваемых определением типов используемых структур и способами композиции структур. Для большинства современных СУБД можно выделить ряд базовых или порождающих типов структур, из которых по определенным правилам композиции могут конструироваться остальные используемые в базе данных структуры.
Определение структуры данных называется схемой Базы данных. Схема составляется на языке определения данных и обычно соотносит данным имена и свойства, устанавливает отношения между ними и другими.
Обработка данных, извлекаемых по запросам пользователей, обычно производится с помощью языков программирования. Взаимодействие языка программирования с Базой данных осуществляется с помощью специально включаемых в него средств, называемых языками манипулирования данными, позволяющих обращаться к Базе данных в терминах используемого языка. Многие Базы данных допускают взаимодействие с прикладными программами, написанными на одном из множества допустимых языков программирования. Причем, каждая область использования Базы данных устанавливает так называемую подсхему данных — определение используемой части Базы данных с точки зрения использующего её приложения.
База данных в СУБД ACCESS
... друг от друга и от места хранения баз данных, созданы сетевые мультипользовательские версии БД основанных на реляционной структуре. В них тем или иным путем решаются специфические проблемы ... 1.2. СУБД MS Access СУБД Access является системой управления базами данных реляционного типа. Данные хранятся в такой базе в виде таблиц, строки (записи) которых состоят из наборов полей определенных типов. ...
Современные идеи в построении Базы данных сконцентрированы в трех наиболее известных моделях данных — модели данных иерархической, модели данных реляционной и модели данных сетевой.
1.2 Классификация баз данных и СУБД
Классификация — особый случай применения логической операции деления объема понятия, представляющий собой некоторую совокупность делений (деление некоторого класса на виды, деление этих видов и т. д.).
В силу многогранности баз данных и СУБД (комплекса технических и программных средств для хранения, поиска, защиты и использования данных) имеется множество классификационных признаков.
1.3 Состав СУБД и работа базы данных
СУБД представляет собой оболочку, с помощью которой при организации структуры таблиц и заполнения их данными получается та или иная база данных. Программные средства включают систему управления, обеспечивающую ввод-вывод, обработку и хранение информации, создание, модификацию и тестирование базы данных, трансляторы. Базовыми внутренними языками программирования являются языки четвертого поколения.
Следует отметить, что исторически для системы управления базой данных сложились три языка:
1) язык описания данных — для построения структуры («шапки») таблиц базы данных;
2) язык манипулирования данными — для заполнения базы данных данными и операций обновления (запись, удаление, модификация);
3) язык запросов — язык поиска наборов величин в файле в соответствии с заданной совокупностью критериев поиска и выдачи затребованных данных без изменения содержимого файлов и базы данных (язык преобразования критериев в систему команд).
С помощью языков базы данных создаются приложения, базы данных и интерфейс пользователя, включающий экранные формы, меню, отчеты.
Для работы с созданной базой данных пользователю или администратору базы данных следует иметь перечень файлов-таблиц с описанием состава их данных (структуры, схемы).
Для этого создается специальный файл, называемый словарем данных (депозитарием, словарем-справочником, энциклопедией).
Описание БД относится к метаинформации.
В качестве технических средств могут выступать супер- или персональные компьютеры с соответствующими периферийными устройствами.
Организационно-методические средства — это совокупность инструкций, методических и регламентирующих материалов, описаний структуры и процедуры работы пользователя с СУБД и базой данных.
1.4 Свойства полей базы данных
Поля базы данных не просто определяют структуру базы — они еще определяют групповые свойства данных, записываемых в ячейки, принадлежащие каждому из полей:
- имя поля;
- тип поля;
- размер поля;
- формат поля;
- маска ввода;
- подпись;
- значение по умолчанию;
- условие на значение;
- сообщение об ошибке;
- обязательное поле;
- пустые строки;
- индексированное поле.
Поскольку в разных полях могут содержаться данные разного типа, то и свойства у полей могут различаться в зависимости от типа данных. Так, например, список вышеуказанных свойств полей относится в основном к полям текстового типа. Поля других типов могут иметь или не иметь эти свойства, но могут добавлять к ним и свои. Например, для данных, представляющих действительные числа, важным свойством является количество знаков после десятичной запятой. С другой стороны, для полей, используемых для хранения рисунков, звукозаписей, видео клипов и других объектов OLE, большинство вышеуказанных свойств не имеют смысла.
1.5 Типы данных
Таблицы баз данных, как правило, допускают работу с гораздо большим количеством разных типов данных:
- текстовый;
- числовой;
- дата/время;
- счетчик;
- логический;
- гиперссылка и др.
Таблица 1
Номер |
ФИО |
Должность |
Телефон |
|
001 |
Иванов П.С. |
Директор |
123-123 |
|
002 |
Сидоров В.Г. |
Водитель |
145-145 |
|
003 |
Сименова А.Н. |
Бухгалтер |
126-126 |
|
004 |
Чечерина К.А. |
Продавец |
147-159 |
|
1.6 Безопасность баз данных
Базы данных — это тоже файлы, но работа с ними отличается от работы с файлами других типов, создаваемых прочими приложениями. Выше мы видели, что всю работу по обслуживанию файловой структуры берет на себя операционная система. Для базы данных предъявляются особые требования с точки зрения безопасности, поэтому в них реализован другой подход к сохранению данных.
Базы данных — это особые структуры. Информация, которая в них содержится, очень часто имеет общественную ценность. Поэтому целостность содержимого базы не может и не должна зависеть ни от конкретных действий некоего пользователя, забывшего сохранить файлы перед выключением компьютера, ни от перебоев в электросети.
Проблема безопасности баз данных решается тем, что в СУБД для сохранения информации используется двойной подход. В части операций, как обычно, участвует операционная система компьютера, но некоторые операции сохранения происходят в обход операционной системы.
2.1 Основные понятия
База знаний — совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе управления база знаний используются методы искусственного интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.
Рисунок 2
Знания о предметной области, ее объектах и закономерностях описываются на некотором формальном языке, называемом языком представления знаний. При этом, язык представления данных должен обеспечивать не только возможность формальной записи знаний, но и необходимую обработку элементов этой записи.
Совокупность знаний, хранящаяся во внешней памяти ЭВМ, называется системой знаний; над ней производятся различные операции: поиск необходимой информации, ее модификация, интерпретация знаний, вывод новых знаний на основе имеющихся и т.д.
Процесс построения базы знаний на основе информации эксперта состоит из трех этапов: описание предметной области, выбор способа и модели представления знаний и приобретение знаний. Сам процесс построения базы знаний достаточно сложен, как правило, плохо структурирован и носит итеративный характер, заключающийся в циклической модификации базы знаний на основе результатов ее тестирования. На первом шаге построения базы знаний четко очерчивается предметная область, т.е. инженер знаний определяет область применения будущей системы и класс решаемых ею задач. Инженер знаний формально описывает предметную область на языке представления знаний, т.е. создает модель представления знаний.
2.2 Классификация баз знаний
В зависимости от уровня сложности систем, в которых применяются базы знаний, различают:
1) БЗ всемирного масштаба — например, Интернет или Википедия;
2) БЗ национальные — например, Википедия;
3) БЗ отраслевые — например, Автомобильная энциклопедия;
4) БЗ организаций;
5) БЗ экспертных систем;
6) БЗ специалистов.
2.3 Система управления базами знаний
Система управления базами знаний — это объектная база данных с возможностями интеллектуального поиска и автоматического переупорядочивания структуры в зависимости от действий.
Характерные черты:
- иерархическая организация знаний;
- специализированные средства для обработки конструкторских данных и знаний;
- специализированный инструментарий для работы с деревьями составов;
- средства реорганизации и адаптации баз знаний к специфике задач;
- расширяемая библиотека функций и команд для разработки приложений.
Система управления базой знаний (СУБЗ) объектно-ориентированной обладает следующими возможностями:
Сохранять текущее состояние графа объектов или нейронной сети в СООБЗ между сеансами работы с пользователем. В том числе сохраняется текущая топология сети объектов. При повторном запуске приложения не понадобится создавать сеть объектов заново. При большем количестве экземпляров объектов ограничить объем памяти, используемый графом объектов или нейронной сетью. Наиболее часто используемые объекты остаются в оперативной памяти, остальные вытесняются в файловое хранилище и загружаются в оперативную память по мере необходимости. При загрузке экземпляра в оперативную память он вытесняет другие, редко используемые объекты. Ограничение объема памяти позволяет избавиться от использования файла подкачки операционной системы, что значительно повышает производительность моделирования сетей с большим количеством экземпляров объектов (при суммарном размере всех экземпляров большем, чем размер текущей свободной памяти в системе).
В случае если объем сети объектов меньше чем размер текущей свободной памяти в системе, вся сеть находится в оперативной памяти и потерь производительности, связанных с сериализацией — десериализацией не возникает.
2.4 Модели представления знаний
Совокупность знаний нужных для принятия решений, принято называть предметной областью или знаниями о предметной области. В любой предметной области есть свои понятия и связи между ними, своя терминология, свои законы, связывающие между собой объекты данных предметной области, свои процессы и события. Кроме того, каждая предметная область имеет свои методы решения задач.
Решая задачи такого вида на ЭВМ используют ИС, ядром которых являются базы знаний, содержащие основные характеристики предметных областей. При построении баз знаний используются специальные языки представления знаний, основанные на символьном представлении данных. Они делятся на типы по формальным моделям представления знаний:
- продукционные модели;
- логические модели;
- сетевые модели;
- фреймовые модели.
Продукционные и логические модели: знания в таких моделях представляются в следующей форме: «Если А, то В». Вместо А и В могут стоять некоторые утверждения, факты, приказы и т.д.
В основе сетевых моделей представления знаний лежит идея о том, что любые знания можно представить в виде совокупности объектов (понятий) и связей (отношений) между ними. В отличие от продукционных эти модели более наглядны, поскольку любой пример можно представить в виде ориентированного (направленного) графа.
В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сети и сценарии.
2.5 Применение баз знаний
Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.
Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.
База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации.
Создание и использование систем искусственного интеллекта потребует огромных баз знаний.
3.1 Основные понятия
Банк данных — это одна из форм информационных систем. Банком данных называют систему специальным образом организованных баз данных, программных, технических, языковых и организационно- методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.
В этом определении обозначены характерные ее основные черты :
- базы данных создаются обычно для решения нескольких связанных задач группой пользователей;
- в банке данных имеются специальные средства, облегчающие для пользователей работу с данными (СУБД).
Централизованное управление данными имеет преимущества по сравнению с обычной файловой системой:
- сокращение избыточности хранения данных;
- сокращение трудоемкости разработки, эксплуатации и модернизации ИС;
- обеспечение удобного доступа к данным как пользователям профессионалам в области обработки данных, так и конечным пользователям.
Основные требования, предъявляемые к банку данных:
1) адекватность отображения предметной области (полнота, целостность и непротиворечивость данных, актуальность информации;
2) возможность взаимодействия пользователей разных категорий, высокая эффективность доступа к данным;
3) дружелюбность интерфейсов, малое время на обучение;
4) обеспечение секретности и разграничение доступа к данным для разных пользователей;
5) надежность хранения и защита данных.
Ядром банка данных является база данных. Централизованное хранилище метаинформации называется словарем данных. Особенно большое значение имеют словари данных в системах автоматизированного проектирования ИС.
Операционную систему иногда включают в состав банка данных, так как СУБД тесно взаимодействует с ОС в процессе работы.
Технические средства включают в себя универсальную ЭВМ, периферийные средства ввода- вывода информации, средства работы в сети.
Организационно — методические средства — это инструкции, методические и регламентные материалы для пользователей.
Персонал — это специалисты, которые обеспечивают создание, работу и развитие БнД.
3.2 Основные задачи, решаемые персоналом банка данных
Перечислим основные функции и задачи, решаемые персоналом при разработке и эксплуатации базы данных:
1) анализ предметной области (определение потребностей конечных пользователей, построение информационной модели предметной области, выявление ограничений целостности);
2) проектирование структуры базы данных (определение состава и структуры файлов базы данных, описание ее схемы на языке описания данных);
3) задание ограничений целостности базы данных;
4) загрузка и ведение базы данных; разработка технологии загрузки и ведения; разработка форм ввода данных; ввод и контроль данных;
5) защита данных (разграничение пользователей, выбор и проверка средств защиты, фиксация попыток несанкционированного доступа);
6) обеспечение восстановления базы данных;
7) анализ эффективности банка данных и развитие системы;
8) работа с пользователями;
9) сопровождение системного программного обеспечения;
10) организационно-методическая работа (выбор методов проектирования и модернизации, планирование развития банка данных, разработка документации).
Таблица 2
№ личного дела |
Фамилия |
Имя |
Отчество |
Дата рождения |
Группа |
|
16493 |
Сергеев |
Игорь |
Петрович |
01.01.1996 |
111 |
|
16593 |
Иванов |
Петр |
Андреевич |
02.03.1994 |
112 |
|
16693 |
Мохов |
Петр |
Борисович |
04.12.1995 |
113 |
|
3.3 Классификация банков данных
Банки данных, как целое, обычно классифицируют по экономико-правовым признакам:
* по условиям предоставления услуг различают бесплатные и платные банки, которые, в свою очередь, делятся на коммерческие и бесприбыльные (научные, библиотечные или социально-значимые).
* по форме собственности банки данных делятся на государственные и негосударственные. По степени доступности различают общедоступные и с ограниченным кругом пользователей.
Другие виды классификации связаны с отдельными компонентами банка данных.
Разработка банков данных состоит из 4-х этапов:
1этап. Формирование и анализ требований к системе:
- составляется спецификация системы, включающая список задач, которые должен решать банк данных;
- перечень конечных пользователей и их функций;
- перечень требований к базу данных;
- составляется схема документооборота в организации.
2 этап. Концептуальное проектирование: создается информационная модель системы без привязки к типу ЭВМ и типу системных программных средств; строится инфологическая модель базы данных, которая наиболее полно описывает предметную область в терминах пользователя.
3 этап. Проектирование реализации: выбирается вычислительная система, системные программные средства и СУБД; проектируется структура данных и строится даталогическая модель базы данных, которая представляет собой описание логической структуры базы данных на языке конкретной выбранной СУБД.
4 этап. Физическая реализация, которая включает в себя создание и загрузку данных в базе данных, разработку и отладку прикладных программ для работы с базой данных, написание документации. На этом этапе строится физическая модель базы данных, которая описывает используемые запоминающие устройства, способы физической организации данных. Описание физической структуры базы данных называют схемой хранения. В настоящее время наблюдается тенденция к сокращению этого вида работ.
Таким образом, базы данных и банки данных являются мощным средством для хранения, накопления и манипулирования информацией в информационных системах. Ни одна современная информационная система не обходится без использования баз данных и их компонентов.
Системы управления базами данных позволяют легко взаимодействовать с различными типами баз данных, создавать сложные запросы, процедуры и макросы для манипулирования данными.
Концепция баз знаний, являясь логическим развитием монопольно-файловых систем и систем, основанных на концепции баз данных, создает предпосылки для расширения возможностей отображения закономерностей предметной области и получения новых знаний путем их вывода.
В заключение отметим, что большинство исследователей искусственного интеллекта рассматривают задачу разработки моделей представления знаний как задачу программной реализации концепции баз знаний. Это означает, что модели представления знаний должны обладать всеми свойствами, присущими знаниям.
1. Ревунков Г.И., Самохвалов Э.Н. Базы и банки данных и знаний/Г.И Ревунков, Э.Н. Самохвалов. — М.: Высш. шк., 1992. — 392 с.
2. Диго С.М. Проектирование и использование баз данных/С.М. Диго. — М.: Финансы и статистика, 1995. — 208 с.
3. Змитрович А.И. Базы данных/А.И. Змитрович. — Мн.: Университетское, 1991. — 271 с.
4. Нагао. Структуры и базы данных/Нагао. — М.: Мир, 1985. — 198 с
5. Дейт Д. Введение в системы баз данных/Д. Дейт. — М.: Наука, 1980. — 464 с.
6. Краковик А. Базы данных/А. Краковик. — М.: Мир, 1988. — 246 с.
7. Каймин В.А. Информатика: Учебник-2е изд., переработанное и дополненное/В.А. Каймин — М.: ИНФРА, 2002.
8. Лорьер, Жан-Луи. Системы искусственного интеллекта/Жан-Луи. Лорьер. — М.: 1991.