Подсистема хранения информации. Понятия о базах данных. Графическая и атрибутивная базы данных

Пожалуй, основным ядром каждой информационной системы (и ГИС в том числе), является база данных (БД). Под базой данных понимается поименованная совокупность данных, отображающая состояние объекта, его свойства и взаимоотношения с другими объектами, а также комплекс технических и программных средств для ведения этих баз данных.

В самом общем смысле база данных (БД) — это набор записей и файлов, организованных специальным образом. В базе данных любой ГИС можно хранить, например, фамилии и адреса друзей или клиентов (текстовая информация) и карту города с нанесенными домами (графическая информация), координаты, значения площадей, другие количественные характеристики (метрическая информация).

Базы данных делятся на иерархические, сетевые и реляционные.

Иерархические базы данных устанавливают строгую подчиненность между записями.

Для хранения данных, имеющих такую структуру, была разработана иерархическая модель данных, которую иллюстрирует рис. 9.12.

Сетевые базы данных использовались в том случае, если структура данных оказывалась сложнее, чем обычная иерархия, т. е. простота структуры иерархической базы данных становилась ее недостатком. Как сетевые, так и иерархические базы данных были очень жесткими. Наборы отношений и структуру записей приходилось задавать заранее.

Изменение структуры базы данных обычно означало перестройку всей базы данных, а для получения ответа на запрос приходилось писать специальную программу поиска данных. Реализация пользовательских запросов часто затягивалась на недели и месяцы, и к мо менту появления программы информация, которую она предоставляла, часто оказывалась бесполезной.

Недостатки иерархической и сетевой моделей привели к появлению новой, реляционной модели данных. Реляционная модель была попыткой упростить структуру БД. В ней все данные были представлены в виде простых таблиц, разбитых на строки и столбцы.

В реляционной базе данных информация организована в виде таблиц, разделенных на строки и столбцы, на пересечении которых содержатся значения данных. У каждой таблицы имеется уникальное имя, описывающее ее содержимое. Более наглядно структуру таблицы иллюстрирует рис. 9.13, на котором изображена таблица РАЙОНЫ.

Каждая горизонтальная строка этой таблицы представляет отдельную физическую сущность — один административный район. Она же представлена на карте отдельным графическим объектом.

Таблица Районы.

ID

Район

Районный центр

Код объекта

Площадь района тыс. га

I Число жителей, тыс.чел.

1

Пушкинский

Пушкин

108

63,4

158

2

Клинский

Клин

106

200,0

138

3

Каширский

Кашира

104

62,8

74,7

4

Рузский

Руза

105

155,9

68,8

I N

I Подольский

Подольск

118

106,2

75.5

Число жителей в тыс.чел.

Название района Код объекта, определенный пользователем

Данные о

Данные о районе

Рис. 9.13

Все N строк таблицы вместе представляют все N районов одной области. Данные, содержащиеся в конкретной строке таблицы, относятся к району, который описывается этой строкой.

Все значения, содержащиеся в одном и том же столбце, являются данными одного типа. Например, в столбце Районный центр содержатся только слова, в столбце Площадь содержатся десятичные числа, а в столбце ID содержатся целые числа, представляющие коды объек тов, установленные пользователем. Связь между таблицами осуществляется по полям.

Каждая таблица имеет собственный, заранее определенный набор поименованных столбцов (полей). Поля таблицы обычно соответствуют атрибутам объектов, которые необходимо хранить в базе. Количество строк (записей) в таблице не ограничено, и каждая запись несет информацию о каком-либо объекте.

На сегодняшний день реляционные базы данных являются наиболее популярной структурой для хранения данных, поскольку сочетают в себе наглядность представления данных с относительной простотой манипулирования ими.

При использовании ГИС в картографии в реляционных БД содержатся два типа данных: графические и атрибутивные (или семантические).

В графической базе данных хранится так называемая графическая или метрическая основа карты в цифровом виде. Атрибутивная база данных содержит в себе определенную смысловую нагрузку карты и дополнительные сведения, которые относятся к пространственным данным, но не могут быть прямо нанесены на карту —- это описание территории или информация, описывающая качественные характеристики объектов (атрибуты). Таблица, содержащая атрибуты объектов, называется таблицей атрибутов; например, при сборе характеристик по городу можно указать численность жителей, число театров и концертных залов, протяженность автодорог и линий связи; по району — его общую площадь и число землепользователей; по сотруднику предприятия — имя, фамилия, отчество, пол, возраст, стаж работы, размер заработной платы и т. д. Для хранения всей этой информации применяют атрибутные таблицы.

В ГИС обычно встроены не только средства отображения базы данных, но и специальные программы — так наз. системы управления базами данных (СУБД). С использованием СУБД осуществляется поиск, сортировка, добавление и исправление информации в базах данных. Этот модуль позволяет создать новую атрибутивную таблицу, заполнить ее и привязать к карте.

Не следует думать, что графические объекты живут сами по себе, а атрибутика — сама по себе. Напротив, интеграция достигает порой той степени, когда графический объект физически хранится как одно из полей атрибутивной таблицы; несколько же других полей реально в таблице базы данных не существуют, а отображают автоматически отслеживаемые географические параметры объекта (длину, периметр, площадь).

Атрибутивные базы данных не только помогают по-разному отобразить объекты с различными свойствами. При выполнении пространственных запросов атрибутика помогает более точно идентифицировать объект; в самом простом случае мы можем указать объект на карте и получить о нем подробную информацию (номер, имя, размер и т. д.) Можно, разумеется, организовывать выбор объектов на карте посредством запросов к атри-

Связь графических и атрибутивных баз данных в ГИС

Рис. 9.14. Связь графических и атрибутивных баз данных в ГИС

бутивной таблице, т. к. мы знаем, что выделение объектов связано с выделением их атрибутивных записей.

Все объекты и графические примитивы (точки, линии, фигуры) должны иметь свой номер или идентификатор, при помощи которого можно поставить в соответствие к графической информации атрибутивную (рис. 9.14).

Использование идентификаторов открывает широкие возможности для просмотра и анализа картографического изображения. Пользователь может указать на объект, например, курсором, и система определит его идентификатор, по которому найдет относящиеся к объекту одну или несколько баз данных и, наоборот, по информации в базе определит графический объект.

Однако набор записей (иногда несколько сот тысяч), содержащий графическую (метрическую) и атрибутивную информацию о каком-либо объекте, хоть и очень похож, однако еще очень далек от того образа реального мира, который мы называем картой. Пока можно говорить только о том, что множество цифровых данных о пространственных объектах образует цифровую модель объекта местности, содержащую сведения о его местоположении (координаты) и набор свойств и характеристик (атрибутов).

Рассматривая вопрос о цифровых моделях, нельзя не отметить, что в реальных ГИС мы имеем дело не с абстрактными линиями и точками, а с объектами, занимающими пространственное положение и имеющими сложные взаимосвязи между собой. Поэтому полная цифровая модель объекта в цифровой карте в обязательном порядке включает в себя:

  • — геометрическую (метрическую) информацию;
  • — атрибуты-признаки, связанные с объектом и его характеризующие;
  • — неметрические (топологические) характеристики, которые объясняют связи между объектами.

К топологическим характеристикам можно отнести ориентацию (по отношению одного объекта к другому); примыкание (наличие общей границы и точек); включение (вложенность контуров), совпадение (наложение одного объекта на другой) и т. п.

Топологические характеристики заносятся при кодировании данных в виде дополнительных атрибутов. Этот процесс во многих ГИС осуществляется автоматически при дигитализации данных.

Но и это еще не все. Чтобы система могла свободно оперировать с огромным числом таким образом организованной пространственной информации, ее наборы необходимо определенным образом соотнести с элементами изображения карты. Для этих целей в большинстве случаев используется метод квантования информации, т. е. разделение ее на целый ряд уровней (слоев). В цифровой картографии данный подход получил название послойного принципа организации элементов изображения. В процессе дигитализации составитель карты может собрать в отдельную группу все элементы гидрографии, в другую — дорожную сеть и т. д. и каждой группе (слою) присвоить свою атрибутивную таблицу. Послойная организация пространственных данных является в настоящий момент одним из общепринятых принципов при конструировании и создании ГИС.

Второй принцип организации элементов изображения — так наз. объектно-ориентированный, когда группировка объектов происходит более сложным образом, в соответствии с логическими связями между ними, с построением различного рода иерархий и зависимостей, в данном пособии рассматриваться не будет.

| 8.В. Подсистема обработки, поиска и анализа данный. Послойная организация данный

Подсистема включает операции, производимые компьютером над географическими данными в информационной системе. К наиболее важным из операций принадлежат те, что обеспечивают выбор и внесение данных в память машины, а также все аналитические операции, которые осуществляются при решении задачи. К наиболее типичным относятся: 1) поиск данных в памяти; 2) установление размерности отдельных исследуемых областей; 3) проведение логических операций над конкретными данными применительно к территориальным единицам исследуемой области; 4) статистические расчеты; 5) специальные математические расчеты в соответствии с требованиями пользователя.

Итак, ГИС хранит информацию о реальном мире в виде набора тематических слоев, которые объединены на основе географического положения тех или иных объектов. Этот простой, но очень гибкий подход доказал свою ценность при решении разнообразных реальных задач.

Слой составляют объекты, объединенные одной темой, например, элементы гидрографии. В традиционной картографии этому примерно соответствуют цветные расчлененные оригиналы карты, выполненные на прозрачных пленках и наложенные друг на друга. В некоторых ГИС в слое могут содержатся объекты одного типа, а не одной темы: слои точек, слои линий, слои полигонов. Иногда в слое могут быть объекты, разные и по типу и по теме, но чаще всего встречается все-таки логическая организация информации на слои (рис. 9.15).

дороги

гидрография -

населенные — пункты

растительность

Концептуальная схема организации данных в ГИС

Рис. 9.15. Концептуальная схема организации данных в ГИС

Поскольку каждый слой может содержать информацию, относящуюся к одной или нескольким темам, то, например, для целей изучения земельных ресурсов такими темами могут быть почвы, их механический состав, использование земель, агроэкология, оценка земель и т. п. Для задач городского кадастра такой набор может включать данные по улицам, развитию инфраструктуры населенных пунктов, подземным коммуникациям, зеленым насаждениям, строениям, землевладельцам и арендаторам недвижимости.

Такое подразделение информации на слои интуитивно понятно и привычно и легко соотносится с общепринятыми принципами работы с бумажной картой.

Послойная организация данных предполагает, что слои в пространстве не имеют разрывов, и что везде мы имеем какую-то информацию.

При наличии соответствующих баз данных и систем управления базами данных (СУБД) при послойной их организации можно без проблем получать ответы как на простые вопросы, например: «Кто владелец данного земельного участка? На каком расстоянии друг от друга расположены некие объекты? Где расположен данный земельный участок? » так и на более сложные ,требующие дополнительного анализа запросы, например: «Где есть места для строительства нового дома? Каков основной тип почв под еловыми лесами? Как повлияет на движение транспорта строительство новой дороги?». Запросы можно задавать как простым щелчком мышью на определенном объекте, так и посредством развитых аналитических средств. С помощью ГИС можно задавать шаблоны для поиска, проигрывать сценарии по типу «что будет, если...». Современные ГИС имеют множество мощных инструментов для анализа, среди которых наиболее значимы два: анализ близости и анализ наложения. Для проведения анализа близости объектов относительно друг друга в ГИС применяется процесс, называемый буферизаций. Он помогает ответить на вопросы типа: «Сколько домов находится в пределах 100 м от этого водоема? Сколько покупателей живет не далее 1 км от данного магазина? Какова сумма арендных платежей за земельные участки, на которых расположены предприятия торговли? »

Процесс наложения включает интеграцию данных, расположенных в разных тематических слоях. Данная процедура получила название оверлейной операции (оверлей слоев). В простейшем случае это операция ото-

114

бражения, но при ряде аналитических операций данные из разных слоев объединяются физически. Наложение, или пространственное объединение, позволяет, например, интегрировать данные о почвах, уклоне, растительности и местоположении землевладения со ставками земельного налога.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >