Кодирование информации
1.1 Кодирование числовой информации
1.2 Кодирование текстовой информации
1.3 Кодирование графической информации
1.4 Кодирование звуков
1.5 Виды информации и способы представления ее в компьютере
2. Форма представления информации
3. Форматы данных
3.1 Ввод/вывод
3.2 Текст
3.3 Графика, изображение
3.4 TIFF
3.5 EPS
3.6 JFJF (JPEG)
3.7 PostScript
3.8 PDF
1. Кодирование информации
Кодирование информации — это представление информации в той или иной стандартной форме.
Информация всегда хранится и передается в закодированном виде. При разговоре информация кодируется с помощью звуков, комбинации из которых образуют слова, а также с помощью жестов, мимики. При записи слова могут быть закодированы с помощью букв, числа с помощью цифр и т.д.
Одна и та же информация может быть закодирована в различных видах. Количество учеников в классе может быть закодировано в виде рисунка, диаграммы, буквенной или числовой записи. При этом сама информация остается неизменной, меняются лишь способы кодирования. Выбор способа кодирования информации зависит от целей кодирования. Если мы хотим найти общее количество учащихся в школе, то для этого удобнее закодировать количество учащихся в каждом классе в виде чисел. А если мы хотим произвести сравнительный анализ количества учащихся по классам, то удобно информацию представить в виде диаграммы.
В то же время совершенно разные сведения могут быть представлены в похожей форме. Например, с помощью азбуки Морзе (точек и тире) можно закодировать разную информацию.
С помощью отдельных знаков или их наборов можно записывать только дискретные сообщения. Поскольку аналоговая информация непрерывна, то записать ее с помощью вышеперечисленных понятий нельзя.
Различные языки служат средством для кодирования информации. Человек в своей практике общения использует много различных языков. Прежде всего это языки устной и письменной речи. Это языки жестов и мимики. Это языки различных указателей, например знаков дорожного движения или пиктограмм олимпийских видов спорта. Кроме того, человек использует ряд языков профессионального назначения. Сюда относятся языки математических формул, обозначений электроники и т.д.
Форматы данных, представление и кодирование информации в компьютере
... информации в компьютере. Объектом изучения , представленным в теоретической части являются данные в компьютере. Цель работы – рассмотреть форматы данных их представление и кодирование в компьютере. Для достижения цели необходимо решить следующие задачи : Рассмотреть существующие форматы данных; Рассмотреть представление различных типов данных в компьютере ...
Возникновение целого ряда языков было продиктовано необходимостью привлечения технических средств для передачи информации. Примером такого языка является азбука Морзе, изобретенная для передачи телеграфных сообщений. В нем каждый символ обычного алфавита кодируется набором точек и тире (что соответствует передаче коротких и длинных электромагнитных импульсов).
Вообще использование двухсимвольного алфавита оказалось столь же естественным в различных технических средствах связи, как десятисимвольного для записи чисел. Дело в том, что технически двухсимвольный алфавит легко реализуется: есть электрический импульс или нет его, есть намагниченность или она отсутствует, проходит свет или не проходит и т.п.
Так же, как 10 пальцев руки послужили основой для возникновения десятичной нумерации, различимость двух состояний той или иной технической системы легла в основу всех современных средств автоматической передачи информации.
1.1 Кодирование числовой информации
Человечество в ходе своего развития придумало различные способы кодирования информации. Следы древних систем счета и кодирования чисел встречаются и сегодня в культуре и обычаях многих народов. К древнему Вавилону восходит деление часа на 60 минут и угла на 360 градусов. К древнему Риму восходит традиция записывать числа в римской записи небольшие числа. Римскими цифрами, например, мы привыкли записывать номер века. Часто с их помощью нумеруются главы книг, записываются числа на циферблатах часов. К англосаксам — жителям Британских островов — восходит традиция счета дюжинами: в году 12 месяцев, в футе 12 дюймов, в сутках 24 часа (два периода по 12 часов).
Особую роль числа 40 помнит русский язык: сохранилось выражение “сорок сороков”, да и само число сорок выбивается из принципа образования ряда числительных, основанных на десятке (двадцать, тридцать, пятьдесят, шестьдесят, семьдесят, восемьдесят).
По современным данным, развитые системы нумерации впервые появились в Древнем Египте и Месопотамии. Для записи чисел египтяне применяли иероглифы, обозначающие числа один, десять, сто и т.д. до десяти миллионов. Числа, конечно, было записывать не очень удобно, запись многих чисел получалась очень громоздкой, например, число девять приходилось записывать девятью одинаковыми иероглифами, число девяносто — другими девятью одинаковыми иероглифами. Чтобы записать число 99, требовалось 18 иероглифов!
Этого недостатка лишены системы записи чисел, принятые в свое время у ионийцев, древних евреев, финикийцев, армян, грузин, а также и у славян. Славянская нумерация напоминала современную позиционную. В ней числа были закодированы буквами, а над этими буквами, чтобы избежать путаницы, ставился специальный знак — титло. Первая буква латинского алфавита с титлом обозначала 1(г), вторая — два и т.д. до 9, десятая буква с титлом обозначала 10, одиннадцатая — двадцать, двенадцатая — тридцать и т.д. Таким образом, каждой из чисел 1,10,20,…,90,100,200,…,900 соответствовала своя буква. Для больших чисел использовались те же самые буквы с добавленными к ним специальными значками.
Системой счисления называется способ записи (кодирования) чисел. Все системы счисления можно разделить на две группы: позиционные и непозиционные.
Системы управления базами данных
... для отображения дробной части числа. Запись - совокупность логически связанных полей. Экземпляр записи — отдельная реализация записи, содержащая конкретные значения ее полей. Файл (таблица ключами первичными системы управления базами данных Система управления базами данных (СУБД) Первые СУБД, поддерживающие ...
Позиционной называется такая система счисления, в которой величина цифры зависит от позиции (места), занимаемой этой цифрой в записи числа. Примером позиционной системы счисления служит арабская система счисления, которой мы обычно пользуемся. Если взять два числа 102 и 21, то цифра 1 в первом числе в 100 раз «тяжелее» той же цифры во втором числе. А вот цифра 2 в первом числе в 10 раз «легче» этой же цифры во втором числе.
Если же величина цифры не зависит от места, занимаемого этой цифрой, то такая система счисления называется непозиционной. Непозиционные системы счисления первичны по своему происхождению; но поскольку они имеют ряд недостатков по сравнению с позиционными системами счисления, то постепенно они потеряли свое значение. Хотя до настоящего времени еще используется римская система счисления, где для обозначения цифр используются латинские буквы:
I V X L C D M
1 5 10 50 100 500 1000
Числа в римской системе счисления записываются по определенным правилам. Вот они:
1) если большая цифра стоит перед меньшей, они складываются, например: VI=6;
2) если меньшая цифра стоит перед большей, то из большей вычитается меньшая, причем в этом случае меньшая цифра уже повторяться не может, например: XL=40, XXL-нельзя;
3) цифры M,C,X,I могут повторяться в записи числа не более трех раз подряд;
4) цифры L, D, V могут использоваться в записи числа только по одному разу.
Например число 1996 будет записано в римской система счисления как MCMXCVI.
Самое большое число, которое можно записать в этой системе счисления, это число 3999 (MMMCMXCIX).
Для записи еще больших чисел пришлось бы вводить еще новые обозначения.
А теперь попробуйте выполнить простую арифметическую операцию, не переводя числа в привычную систему счисления: умножить число CLVI на число LXXIV. Вряд ли вам это удастся.
Таким образом, можно констатировать следующие основные недостатки непозиционных система счисления:
- а) в них нельзя записывать сколь угодно большие числа;
- б) запись чисел обычно громоздка и неудобна;
- в) математические операции над ними крайне затруднены.
Именно поэтому, хотя римская и очень «красивая» система счисления, она не получила широкого распространения.
Можно рассматривать системы счисления и с другими основаниями. Если р — основание системы счисления, то любое число N в этой системе счисления может быть представлено в виде:
N =а(n)*р^n + a(n-1)*p^(n-1) +… + a(1)*p + a(0),
где коэффициенты — цифры р-ичной системы счисления.
Как мы уже говорили, использование двух символьного алфавита оказалось очень удобным в различных технических средствах связи, т.к. технически двух символьный алфавит легко реализуется. Поэтому самое широкое распространение получила двоичная система счисления.
Вопреки распространенному заблуждению, двоичная система счисления была придумана не инженерами — конструкторами ЭВМ, а математиками и философами задолго до появления компьютеров, еще в XVII — XIX веках. Великий немецкий ученый Лейбниц (1646 — 1716) считал:
“Вычисление с помощью двоек … является для науки основным и порождает новые открытия.При сведении чисел к простым началам, каковы 0 и 1, везде появляется чудесный порядок”.
Позже двоичная система была забыта, и только в 1936-1938 гг. американский инженер и математик Клод Шеннон нашел замечательные применения двоичной системы при конструировании электронных схем.
1.2 Кодирование текстовой информации
американский стандартный код для обмена информацией
1.3 Кодирование графической информации
Если очень внимательно рассмотреть рисунки или фотографии, напечатанные в газете или книге, то можно увидеть, что они состоят из отдельных точек. Дело в том, что человеческий глаз изображение, составленное из большого числа мелких точек, воспринимает как непрерывное.
Разобьем картинку вертикальными и горизонтальными линиями на маленькие прямоугольники. Полученный двумерный массив прямоугольников называется растром, а сами прямоугольники — пикселями (это слово произошло от английского picture’s element — элемент картинки).
Теперь, чтобы закодировать изображение, надо закодировать числами цвета каждого пиксела. Чем меньше прямоугольники, тем точнее будет закодировано наше изображение. Информация о графическом изображении хранится в специальном разделе оперативной памяти компьютера, который называется видеопамятью. В видеопамяти содержится информация о состоянии каждого пиксела экрана. Если каждый пиксел может принимать только два состояния: светится — не светится (белый — черный), то для кодирования одного пиксела достаточно одного бита памяти (1 — белый, 0 — черный).
Если надо закодировать большее количество состояний пиксела (различную яркость свечения или различные цвета), то одного бита на пиксел будет недостаточно.
Цвет точки на экране формируется из трех основных цветов: красного, синего, зеленого. Различные цвета получаются в результате наложения цветовых пятен, возникающих под действием лучей трех электронных пушек. Например, сиреневый цвет получается путем наложения красного и синего пятен, желтый цвет — красного и зеленого пятен. Количество цветов увеличивается, если имеется возможность управлять яркостью основных цветов. Например, оранжевый цвет тоже получается из красного и зеленого, но другой яркости. Поэтому цвет пиксела можно закодировать тремя числами — яркостью его красной, зеленой и синей составляющей. Этот способ кодирования называется RGB — по первым буквам английских слов Red, Green, Blue — красный, зеленый, синий.
Обычно для построения качественного цветного изображения достаточно яркость каждого из цветов разбить на 16 градаций (уровней).
Тогда для кодирования яркости одного цвета потребуется 4 бита информации, а для кодирования цвета точки 4*3=12 битов.
1.4 Кодирование звуков
Из курса физики вы знаете, что звук представляет собой колебания воздуха. Амплитуда этого колебания непрерывно меняется во времени. По своей природе звук является непрерывным (аналоговым) сигналом. Для кодирования звука этот аналоговый сигнал превращают в дискретный, а затем кодируют с помощью нулей и единиц. Этот процесс называется дискредитацией. С помощью микрофона звук превращают в колебания электрического тока. Аналогово-цифровой преобразователь (АЦП) измеряет электрическое напряжение в каком-то диапазоне и выдает ответ в виде многоразрядного двоичного числа. Воспроизведение закодированного таким образом звука производится при помощи цифро-аналогового преобразователя (ЦАП).
Полученный на выходе ЦАП ступенчатый сигнал сначала сглаживается при помощи аналогового фильтра, а затем преобразуется в звук при помощи усилителя и динамика.
1.5 Виды информации и способы представления ее в компьютере
В компьютере все виды информации кодируются на машинном языке, в виде логических последовательностей нулей и единиц.
Вид информации |
Двоичный код |
|
Числовая |
1 0 1 1 0 1 1 0 0 |
|
Текстовая |
||
Графическая |
||
Звуковая |
||
Видео |
||
Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1)
Каждая цифра машинного двоичного кода несет количество информации, равное 1 бит.
Например. Латинская буква А представлена в двоичном коде — 01000001.
Русская буква А представлена в двоичном коде — 10000000.
0 — 00110000
1 — 00110001
2. Форма представления информации
В настоящее время все средства массовой информации говорят об ускорении научно-технического процесса, который характеризуется постоянно растущим потоком информации. Для быстрого нахождения необходимой информации, экономии труда и времени человека создаются автоматизированные информационные системы (АИС) и банки информации на базе современных мощных ЭВМ. В промышленности получили широкое распространение автоматизированные системы управления производством (АСУП) и технологическими процессами (АСУ ТП).
АИС, АСУП и АСУ ТП представляют собой человеко-машинные системы. В них за человеком оставлена высшая функция — принятия решения, а техника через средства отображения информации снабжает его необходимыми данными.
Перечисленные системы широко применяются в для управления крупными производствами, технологическими процессами, для информационного обеспечения различных директивных органов, ученых и специалистов.
Информация человеку-оператору в АСУ ТП представляется в основном символами и зрительными образами, сформированными на тех или иных устройствах отображения информации (УОИ).
УОИ обеспечивают связь человека с техническими средствами и переводят машинные языки в языки знаков, известных человеку (дисплеи, принтеры, большие экраны, графопостроители, синтезаторы речи).
Можно на примере структурной схемы АСУ ТП (рис. 1.1.) раскрыть задачи, решаемые подсистемой сбора, обработки и отображения информации в автоматизированных системах.
Основу АСУ ТП составляют ЭВМ, способные решать математические и логические задачи с заданной точностью, принимать, обрабатывать, запоминать, хранить и выдавать различную информацию. В информационных процессах важную роль играют способы представления информации человеку-оператору. Это индикация, регистрация, воспроизведение, размножение, отображение информации [9].
Рис. 1.1 Структура АСУ ТП: ТП — технологический процесс;
- датчики;
- К — коммутатор;
- АЦП — аналого-цифровой преобразователь;
- ПУ — передающее устройство;
- ЛС — линия связи;
- ИП — источник помех;
- ПР — приемник;
- БЗУ — буферное запоминающее устройство;
- ЦАП — цифроаналоговый преобразователь;
- УОИ — устройство отображения информации;
- УУ — устройство управления техпроцессом
[Электронный ресурс]//URL: https://liarte.ru/referat/formatyi-dannyih/
Процессы представления информации тесно связаны с вопросами психологии человека-оператора. Без их взаимодействия невозможно построить ни одной информационной системы, так как на человека возлагаются не только функции контроля за работой устройств, но и оценка обстановки о ходе процесса, принятие и корректировка решения.
Под информацией понимают любые сведения о каком-либо событии или объекте.
Понятие информации в технике родственно понятию отражения, рассматриваемому в философии. Свойство отражения присуще не только объектам, но и процессу и заключается в том, что между состояниями взаимодействующих объектов существует определенная связь. Но философию интересуют прежде всего качественные различия между типами отображения, а нас будут интересовать количественные описания. Например: соответствие между положением стрелки вольтметра и напряжением на его клеммах — стрелка отклоняется вправо, соответственно имеется рост напряжения на клеммах. То есть в этой ситуации один объект (стрелка) отражает другой (напряжение), или один объект содержит информацию о другом. На основании этого примера можно сказать, что информация есть отражение одного объекта другим. Один объект может быть отражен несколькими другими объектами (одними — лучше, другими — хуже) [7].
Подключив вместо вольтметра осциллограф, мы получим больше информации об интересующем нас процессе.
Получение информации связано с восприятием и оценкой объекта или процесса. При этом необходимо отделить информацию от шумов. Результатом восприятия информации датчиками является сигнал в форме, удобной для передачи или обработки.
Передача информации состоит в переносе ее на расстояние посредством сигналов различной физической природы по механическим, оптическим, акустическим, электромагнитным и другим каналам связи. Чаще всего используются электрические и электромагнитные каналы связи.
Обработка информации заключается в машинном решении задач, связанных с преобразованием информации. Обработка производится при помощи устройств, осуществляющих аналоговые или цифровые преобразования поступающих величин или функций. Промежуточным этапом обработки является хранение информации в запоминающих устройствах. (Пример преобразования — контроллер синтезатора речи.)
Представление (отображение) информации требуется в тех случаях, когда в процессе управления принимает участие человек. Отображение заключается в демонстрации изображений, содержащих качественные и количественные характеристики информации, циркулирующей в системе. Для этого используются различные устройства отображения информации и регистрирующие устройства. Например, цифробуквенные индикаторы, ЭЛТ, мнемосхемы, табло, графические регистрирующие приборы — графопостроители и т.д.
Управляющее воздействие состоит в том, что несущий информацию сигнал осуществляет регулирование или управление, вызывая изменения в объекте управления. Воздействие осуществляется с помощью исполнительных устройств, расположенных на объекте (реле, серводвигатели и т.п.).
Информацию, фиксированную в определенной форме, называют сообщением. Сообщение может иметь самое различное содержание, но независимо от этого всегда отображается в виде сигнала (электрического, звукового, светового и др.).
Сообщение — это форма представления информации.
Формирование любого сигнала связано с передачей сообщения от отправителя (источника) к получателю (приемнику), которые разделены пространством и временем. Поэтому сигнал можно характеризовать как средство перенесения информации в пространстве и времени. Это определение, однако, не учитывает строение сигнала как объекта исследования. Хотя сигнал всегда связан с материальным объектом, большинство конкретных свойств этого объекта несущественно. Например: при ознакомлении с печатным текстом нам неважно, какого сорта бумага или какого цвета чернила. Различие текстов (в общем случае — сигналов) в первую очередь определяется по различию описаний, то есть по различию состояний объекта. Следовательно, можно сказать, что в качестве сигналов используются не сами сигналы, а их состояния. Образование сигнала происходит за счет изменения состояния объекта.
Чтобы было соответствие между сообщением и сигналом, т.е. была возможность получения сообщения из сигнала, сигнал должен формироваться по определенным правилам. Построение сигнала по определенным правилам называют кодированием.
Таким образом, в материально-энергетической форме информация всегда проявляется в виде сигналов.
Первичным и неделимым элементом информации следует считать двоичное событие, то есть утверждение или отрицание, наличие или отсутствие. Двоичное событие условно представляется единицей или нулем, импульсом или паузой. Событие не имеет геометрических измерений и представляется точкой (рис. 1.2).
Рис. 1.2 Формы представления информации: а — событие; б — величина; в — функция; г — комплекс
Множество событий, упорядоченное в одном измерении, называется величиной (рис. 1.2, б ).
Если величина принимает счетное множество значений, то она является дискретной. Если число принимаемых значений бесконечно, то величина является непрерывной. Геометрически величина представляется линией.
Если существует соответствие между величиной и другой величиной, или между величиной и пространством, или величиной и временем, то говорят о функции , Х (N ), X (T ) (рис. 1.2, в ).
Геометрическая функция может быть представлена как поле событий. Различают функции с непрерывным и дискретным аргументом.
Комплекс информации X (T,N )(рис. 1.2, г ) представляет собой соответствие между величиной, с одной стороны, и временем и пространством — с другой. Геометрически комплекс информации представляется трехмерным полем событий.
Информация описывается моделями с различной мерностью: событие представляет собой нульмерную информацию; величина — одномерную; функция — двухмерную; комплекс — трехмерную.
Следуя таким путем далее, можно представить четырехмерную,…, n- мерную информацию. Многомерная информация моделируется многомерным пространством.
Источники и формы сообщений и соответствующие им сигналы бывают дискретные и непрерывные.
Дискретными называются сообщения, состоящие из отдельных элементов (символов, букв, импульсов), принимающих конечное число различных значений. Примерами дискретных сообщений являются команды в системах управления, выходная информация ЭВМ в виде кодовых групп или массивов чисел, телеграфные сообщения. Такие сообщения составляются из конечного числа элементов, следующих друг за другом в определенной последовательности. Набор элементов, из которых составляются сообщения, обычно называют алфавитом.
Непрерывными называются такие сообщения, которые могут принимать в некоторых пределах любые значения и являются непрерывными функциями времени. Примеры: телефонные сообщения, телеметрическая информация и т.д.
В реальных условиях указанные различия между непрерывными и дискретными сообщениями оказываются непринципиальными, и путем дискретизации (во времени) и квантования (по уровню) можно непрерывное сообщение заменить дискретным.
3. Форматы данных
Цифровая техника допечатных процессов сталкивается с большим количеством форматов данных. Даже при ограниченном числе используемых в производственном процессе форматов необходимо считаться с возможными форматами заказов, получаемых от клиентов. Как правило, стремятся ориентироваться на наиболее употребляемые форматы данных, которые характерны для открытых систем допечатной подготовки, а не для закрытых, специальных систем. Во многих производственных системах общепринятые форматы для дальнейшей обработки конвертируются во внутреннюю структуру данных. Если на выходе имеется обратное преобразование, то такой способ обработки данных вполне приемлем.
Рис. 1 Сетевые компоненты и пересылка данных, применяемые при обработке массивов информации (AGFA)
информация кодирование информация сетевой
Рис. 2 Структура и компоненты глобальной сети (Internet) пересылки данных и линий связи (EnBW/Zbigniew Sroga)
Рис. 3 Модульная издательская система
При модульном построении допечатной системы компьютеры и устройства компонуются в соответствии с решаемыми задачами. На различных уровнях связи между устройствами их работу обеспечивают стандарты интерфейсов. При этом речь идет как об общепринятых стандартах (например, ASCII, American Standard Code for Information Interchange), так и о тех, которые когда-то взяли на себя роль «De-facto-Standards» (например, PostScript.)
3.1 Ввод/вывод
На рис. 3 показаны компоненты модульной издательской системы. Форматы данных, используемые на этапе ввода информации, зависят прежде всего от отличий, имеющихся в кодировании текста, графики, изображений и др. На этапе вывода доминирует язык описания страниц PostScript. Являясь аппаратно-независимой структурой данных, PostScript может использоваться для управления целым рядом выводных устройств.
Рис. 4 Представление знака битовой картой (пиксельная структура)
Текстовая информация, векторная графика и полутоновые изображения, кодированные и отображенные в соответствующем формате, образуют поток входных данных.
3.2 Текст
Для обмена текстовыми документами стандартным кодом является ASCII. ASCII (American Standard Code for Information Interchange) не есть собственно формат данных, а описывает прежде всего значки текстовой информации. Преимуществом кодирования ASCII (особенно по международно-принятым нормам 7-битовой кодировки в рамках ASCII) является пригодность и совместимость со всеми операционными системами. Так, например, соответственно с ASCII могут кодироваться как текстовые документы, так и информация в формате PostScript. Преобладающий в Интернете формат данных HTML (Hypertext Mark-up Lan guage) базируется также на наборе символов ASCII.
Практика показала, что текстовой редактор «msWord» стал стандартом де-факто. Со своим расширением «.doc» он может быть воспринят практически всеми программными приложениями. Например, текст может быть сохранен в формате обмена данными «.rtf» (Rich Text Format).
В этом формате возможна работа независимо от платформы, а текстовый файл можно открыть в программе Word на компьютерах PC или Mac или непосредственно импортировать в такие программы, как QuarkXPress.
3.3 Графика, изображения
При цифровой обработке изобразительной информации для кодирования применяются форматы пиксельных и векторных данных. Формат данных, ориентированный на пиксель (битовая карта), предполагает дискретизацию графики или изображения на совокупность точек, распределенных с заданной частотой (рис. 4).
Рис. 5 Начертание буквы, полученной кодированием данных контуров (например, посредством кривых или векторов)
Изобразительная информация может также быть представлена описанием прямыми отрезками и кривыми линиями (рис. 5).
Эта структура данных, введенная, прежде всего, языком описания страницы PostScript и использует для описания кривых большей частью параметрические функции (сплайны).
Несмотря на то что генерирование и декодирование векторного формата математически сложны, его использование в цифровой допечатной технологии позволяет получать преимущество, заключающееся в независимом от разрешения и масштаба результате обработки. Массив данных PostScript может пересылаться на любое выводное устройство независимо от используемого разрешения. И только в процессе интерпретации данных для выводного устройства, производящейся в RIP на основе функционального описания линий, генерируется дискретная структура пикселей.
Во многих современных форматах данных можно найти комбинации из пиксельных и векторных структур. Прежде всего это касается языка описания страниц PostScript и формата «Por table Document Format» (PDF).
В форматах, основанных на пиксельных данных («Tag Image File Format» (TIFF), а также при сохранении рисунков в формате «Encapsulated PostScript» (EPS)) дополнительно к пиксельному изображению могут быть сохранены контуры, например, обрамляющие сюжет с целью его выделения на каком-то фоне.
3.4 TIFF
TIFF — это классический, основанный на пикселях формат данных. Он был первоначально разработан фирмами Aldus (в настоящее время Adobe Systems) и Microsoft. Основные параметры изображения (например, разрешение) сохраняются в тегах (полях признаков), которые задокументированы в руко водстве по формату TIFF [11].
Создаются также специфические фирменные («приватные») теги, содержание которых может быть воспринято только специальными программами. Благодаря свободно задаваемым тегам формат TIFF является употребимым, расширяемым форматом данных и де-фа кто представляет собой отраслевой стандарт. Он базируется на простом методе сжатия «Lempel-Ziv Welch» (LZW), представляющем простую опцию сжатия данных без потерь.
3.5 EPS
При сохранении графических данных применяются преимущественно векторные форматы. Ведущие программы компьютерной графики описывают изображения сплайнами, которые могут быть легко конвертированы в файлы EPS. Как формат, непосредственно образованный от PostScipt, EPS в состоянии как векторный, так и растровый методы описания как по отдельности, так и в комбинации. Формат EPS, в первую очередь, обеспечивает кодирование графики. EPS («Encapsulated PostScript») означает, что в файлах EPS находится информация, которая не может быть изменена.
Формат EPS использует те же операторы, что и язык PostScipt. Файл можно импортировать в другие документы. Для того, чтобы избежать интерпретации всего объема данных при визуализации содержимого файла с помощью растрового процессора (PostScript-RIP), в заголовок файла при его создании загружается изображение низкого разрешения для предварительного просмотра «Preview» (файл низкого разрешения).
Файлы EPS позволяют сохранять как векторные данные, так и битовые карты. Как формат обмена данных EPS использует только свои возможности объемов битовых карт. Файлы EPS так же, как и файлы PostScript, не могут редактировать ся без полной интерпретации в RIP. Их можно перемещать, поворачивать и масштабировать, но нельзя изменять их содержимое.
3.6 JFIF (JPEG)
Формат JPEG (File Interchange Format — JFIF), или формат обмена файлами, используется, прежде всего, при обработке больших массивов данных в оптимизированных по производительности допечатных производствах (например, в газетном производстве), а также в Интернете. Так называемый процесс базовой линии («Baseline») предлагает использование соответствующих модулей сжатия с определенными параметрами как стандартного приложения. Алгоритм сжатия данных изображения по JPEG базируется на дискретном преобразовании Фурье. При значительных потерях информации метод позволяет достигнуть очень высокой степени сжатия (до 1:100).
Однако величина потерь при использовании данного метода зависит также и от сюжетного содержания изображения, поэтому потери трудно точно спрогнозировать. В настоящее время JPEG специфицирован как для данных цветовой модели RGB, так и CMYK, но не определен для данных CIELAB.
3.7 PostScript
Доминирующую роль в цифровых издательских технологиях играет язык описания страниц PostScript. Обычно он используется для того, чтобы описать вид страницы документа и передать ее в систему вывода. Язык PostScript может кодировать все элементы документа, включая текст, графику и изображение.
После первой версии PostScript Level 1 язык описания страниц был развит в PostScript Level 2 и был введеналгоритм растрирования «Accurate Screening». Сегодня работают с PostScript 3 последней версии, которая делает возможным использование давно требовавшихся расширений, таких как интегрирование в систему управления цветом и интерпретация массива данных PDF.
PostScript как язык для пользователя почти незаметен. Он генерируется, как правило, драйвером компьютерной системы, по сети передается на устройство вывода, транслируется интерпретатором RIP в коды устройств вывода (чаще всего в битовые карты).
Аппаратная независимость — исключительная особенность этого языка — обеспечивается посредством внутренней структуры массива данных (векторы и кривые Безье).
PostScript содержит как аппаратно-независимые, так и специфические компоненты. Специфическая часть массива данных PS генерируется в драйвере посредством выбора так называемого файла «PostScript-Printer-Description» (PPD).
В массиве данных PPD содержатся все специфические свойства печатающей системы или экспонирующего устройства (например, количество и направление движения бумаги в соответствующий лоток, уровень языка, воспринимаемого интерпретатором).
Если PPD файл не задан, то генерируется универсальный код PostScript, который может работать даже с интерпретаторами первого поколения.
Следующее существенное новшество языку описания страниц PostScript придают шрифты «Adobe Type-1». Этот тип шрифтов впервые оказался независимым от изменения масштаба и разрешения. Как и все другие элементы PostScript, шрифты «Type-1» аппаратно-независимы и могут быть использованы со многими выводными устройствами. Хотя фотовыводные устройства имеют более высокое разрешение, чем большинство печатающих систем, шрифты «Type-1» воспроизводятся в этих системах при максимальном разрешении.
Специальный вариант массива данных PostScript представляет собой формат «Desktop-Color-Separation» (DCS).
Поскольку можно послать на фотовыводное устройство одну-единственную цветоделенную фотоформу в виде предварительно созданного файла PostSсript, передаваемый по сети массив данных может быть сокращен до 25% по сравнению со своей первоначальной величиной 40 Мб для DIN А4. В массиве данных DCS четыре цветоделенные фотоформы сохраняются как четыре отдельных файла в общем PostScript файле. Для работы с оригинал-макетом имеется дополнительный пятый файл, содержащий предназначенное для просмотра нецветоделенное изображение низкого разрешения.
Несмотря на введение формата DCS, на практике более распространенным остаются предварительно цветоделенные файлы PostScript. В так называемых разделенных рабочих потоках («Separated Workflows») цветоделенные изображения и их треппинги полностью рассчитываются, сохраняются раздельно и посылаются по сети как отдельные файлы. Обработка предварительно разделенных цветоделенных массивов данных лишена смысла в новой электронной среде обработки медийно-независимых данных в соответствии с концепцией интегрированного рабочего потока («Composite workflow»).
3.8 PDF
К языку описания страниц PostScript близок формат обмена документами — PDF («Portable Document Format», ).
Он используется, прежде всего, для описания документов. В то время как PostScript представляет собой законченный язык программирования, такой, например, как BASIC или FORTRAN, на котором программисты могут писать программы для пользователей, PDF представляет собой формат данных, сравнимый с EPS или другим векторно-ориентированным форматом. PDF построен на основных элементах (графических примитивах) языка PostScript и также пригоден для описания страниц документа. Формат PDF может включать дополнительную информацию о странице, например, о ее связи с другими частями документа. Файл PDF во многих отношениях выгодно отличается от файла EPS. Он может содержать шрифты, рисунки и указания по выводу, специальные ключевые понятия для поисковой и индексной функции, ярлыки заказа «Job Tickets», интерактивные со единения (Hyperlinks), видео и многое другое. В противоположность PostScript, документ PDF сохраняет каждую страницу публикации отдельно. Таким образом, нет необходимости интерпретировать документ полностью для того, чтобы отпечатать или показать на экра не содержание одной страницы.
Массив данных PDF является, собственно говоря, массивом данных PostScript, интерпретируемым в RIP и четко разделенным на отдельные объекты. Эти объекты могут быть представлены на мониторе уже не в коде ASCII. Так как массивы данных PDF прошли процесс растрирования в RIP, при печати или экспонировании они ведут себя намного надежнее. После интерпретации пользователь может дополнительно посмотреть массив данных перед его выводом на принтер или экспонирующее устройство, проверить ошибки. Чтобы ускорить интерпретацию, применяется техника «Extreme» фирма Adobe.
На практике наряду со специальными форматами обмена данных определенную роль играют и «внутренние форматы» некоторых ключевых программных пакетов (например, QuarkXPress, Photoshop).
Так называемые «открытые форматы» представляют собой хорошую альтернативу прежде всего в тех случаях, когда массивы данных подлежат многократному редактированию и обмену между корпоративными партнерами. Между тем эти форматы не всегда приемлемы прежде всего из-за отсутствия полноты (например, не предусмотрены шрифты), а также они часто несовместимы с различными прикладными программами.
Список использованной литературы
[Электронный ресурс]//URL: https://liarte.ru/referat/formatyi-dannyih/
1. Гуда А.Н., Бутакова М.А., Нечитайло Н.М. Информатика. Общий курс: учебник. — М.: Издательско-торговая корпорация «Дашков и К»; Ростов н/Д: Наука-Пресс, 2007. 400 с.
2. Могилев А.В. информатика: учебное пособие для студентов вузов/ А.В. Могилев, Н.И. Пан, Е.К. Хеннер. 3-е изд., перераб. и доп. М.: Изд. центр «Академия», 2004. 848 с.
3. Степанов А.Н. Информатика: учебник для вузов. 4-е издание. СПб.: Питер, 2006. 684 с.
4. www. yspu.yar.ru/projects/infomet/kodir.
5. www. center.fio.ru/method/Resources.
задание
Реляционная модель данных для исследуемой области
Таблица А
Наименование техники |
Модель |
Цвет |
|
Телевизор |
Samsung TGH803 |
Белый |
|
Телевизор |
LG M986 |
Чёрный |
|
Телевизор |
LG M982 |
Серый |
|
Телевизор |
LG Z933 |
Стальной |
|
Телевизор |
Samsung Е567 |
Серый |
|
Таблица B
Наименование техники |
Модель |
Цвет |
|
Цифровой фотоаппарат |
Canon 33Z |
Оранжевый |
|
Цифровой фотоаппарат |
Pilips 567 |
Красный |
|
Цифровой фотоаппарат |
Сasio 650 |
Белый |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
|
Цифровой фотоаппарат |
Toshiba M21 |
Зелёный |
|
Таблица С
Наименование техники |
Модель |
Цвет |
|
Тарелка TV |
НТВ плюс |
Зелёный |
|
Тарелка TV |
Радуга ТВ |
Серый |
|
Тарелка TV |
Триколор тв |
Белый |
|
Тарелка TV |
Рикор ТВ |
Бежевый |
|
Тарелка TV |
Континент |
Чёрный |
|
Таблица D
Наименование техники |
Модель |
Цвет |
|
DVD |
LG 2307 |
Чёрный |
|
DVD |
Pilips 336Е |
Красное дерево |
|
DVD |
Toshiba С432 |
Белый |
|
DVD |
Samsung 970 |
Серый |
|
DVD |
Toshiba В891 |
Бежевый |
|
ТаблицаE
Пользователь |
Рост(см) |
Вес(кг) |
|
Бородина Ю.В. |
156 |
53 |
|
Каменева Е.Д. |
172 |
54 |
|
Корченкина А.В. |
164 |
45 |
|
Годовикова Е.С. |
164 |
54 |
|
Андронова А.А. |
163 |
54 |
|
3 задание
Операции над сущностями
Таблица А1
Наименование техники |
Модель |
Цвет |
|
Телевизор |
Samsung TGH803 |
Белый |
|
Тарелка TV |
НТВ плюс |
Зелёный |
|
DVD |
LG 2307 |
Чёрный |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
|
Телевизор |
LG Z933 |
Стальной |
|
Таблица B1
Наименование техники |
Модель |
Цвет |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
|
DVD |
Toshiba С432 |
Белый |
|
Телевизор |
LG Z933 |
Стальной |
|
Тарелка TV |
Рикор ТВ |
Бежевый |
|
DVD |
Pilips 336Е |
Красное дерево |
|
1. Объединение отношений (таблиц)
Таблица C1
Наименование техники |
Модель |
Цвет |
|
Телевизор |
Samsung TGH803 |
Белый |
|
Тарелка TV |
НТВ плюс |
Зелёный |
|
DVD |
LG 2307 |
Чёрный |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
|
Телевизор |
LG Z933 |
Стальной |
|
DVD |
Toshiba С432 |
Белый |
|
Тарелка TV |
Рикор ТВ |
Бежевый |
|
DVD |
Pilips 336Е |
Красное дерево |
|
2. Пересечение отношений
Таблица C2
Наименование техники |
Модель |
Цвет |
|
Телевизор |
LG Z933 |
Стальной |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
|
3. Разность отношений
Таблица C3
Наименование техники |
Модель |
Цвет |
|
Тарелка TV |
НТВ плюс |
Зелёный |
|
DVD |
Pilips 336Е |
Красное дерево |
|
Тарелка TV |
Рикор ТВ |
Бежевый |
|
4. Декартово произведение
Таблица А2
Наименование техники |
Модель |
Заводской номер |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
|
Тарелка TV |
НТВ плюс |
667890653KL |
|
DVD |
LG 2307 |
8R668790012 |
|
Цифровой фотоаппарат |
Samsung Е46 |
45678H5677К |
|
Таблица B2
Цвет |
Цена |
Номер чека |
|
Белый |
3000 |
567001 |
|
Серый |
8000 |
677021 |
|
Таблица С2.1
Наименование техники |
Модель |
Заводской номер |
Цвет |
Цена |
Номер чека |
|
DVD |
LG 2307 |
8R668790012 |
Белый |
3000 |
567001 |
|
DVD |
LG 2307 |
8R668790012 |
Серый |
8000 |
677021 |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
Белый |
3000 |
567001 |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
Серый |
8000 |
677021 |
|
Тарелка TV |
НТВ плюс |
667890653KL |
Белый |
3000 |
567001 |
|
Тарелка TV |
НТВ плюс |
667890653KL |
Серый |
8000 |
677021 |
|
Цифровой фотоаппарат |
Samsung Е46 |
45678H5677К |
Белый |
3000 |
567001 |
|
Цифровой фотоаппарат |
Samsung Е46 |
45678H5677К |
Серый |
8000 |
677021 |
|
5. Проекция отношений
Таблица А3
Наименование техники |
Модель |
Цвет |
Цена |
|
DVD |
LG 2307 |
Серый |
8000 |
|
Цифровой фотоаппарат |
Samsung Е46 |
Белый |
3000 |
|
Телевизор |
Samsung TGH803 |
Серый |
8000 |
|
Тарелка TV |
НТВ плюс |
Зелёный |
8000 |
|
Тарелка TV |
Рикор ТВ |
Белый |
3000 |
|
Таблица С3
Проекция на поля «Цвет», «Цена»
Цвет |
Цена |
|
Зелёный |
8000 |
|
Серый |
8000 |
|
Белый |
3000 |
|
6. Деление отношений (таблиц)
Таблица А4
Наименование техники |
Модель |
Заводской номер |
Цвет |
Цена |
Номер чека |
|
Тарелка TV |
НТВ плюс |
667890653KL |
Белый |
3000 |
567001 |
|
Тарелка TV |
НТВ плюс |
667890653KL |
Серый |
8000 |
677021 |
|
DVD |
LG 2307 |
8R668790012 |
Белый |
3000 |
567001 |
|
DVD |
LG 2307 |
8R668790012 |
Серый |
8000 |
677021 |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
Белый |
3000 |
567001 |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
Серый |
8000 |
677021 |
|
Таблица В4
Наименование техники |
Модель |
Заводской номер |
|
Тарелка TV |
НТВ плюс |
667890653KL |
|
DVD |
LG 2307 |
8R668790012 |
|
Телевизор |
Samsung TGH803 |
34668990D73 |
|
Таблица С4
Цвет |
Цена |
Номер чека |
|
Белый |
3000 |
567001 |
|
Серый |
8000 |
677021 |
|
7. Выбор из отношения
Таблица А5
Наименование техники |
Модель |
Цвет |
Цена |
|
Тарелка TV |
НТВ плюс |
Белый |
3000 |
|
Тарелка TV |
НТВ плюс |
Зелёный |
3000 |
|
Цифровой фотоаппарат |
Samsung Е46 |
Серый |
8000 |
|
Телевизор |
LG Z933 |
Стальной |
3000 |
|
DVD |
LG 2307 |
Серый |
8000 |
|
Таблица С5
Наименование техники |
Модель |
Цвет |
Цена |
|
Тарелка TV |
НТВ плюс |
Белый |
3000 |
|
Тарелка TV |
НТВ плюс |
Зелёный |
3000 |
|
Телевизор |
LG Z933 |
Серый |
3000 |
|
8. Соединение отношений
Таблица А6
Наименование техники |
Модель |
Цена |
|
Тарелка TV |
НТВ плюс |
3000 |
|
Цифровой фотоаппарат |
Samsung Е46 |
8000 |
|
DVD |
LG 2307 |
8000 |
|
Телевизор |
LG Z933 |
3000 |
|
Таблица В5
Цвет |
Цена |
Номер чека |
|
Белый |
3000 |
567001 |
|
Серый |
8000 |
677021 |
|
Таблица С6
Наименование техники |
Модель |
Цена |
Цвет |
Номер чека |
|
Тарелка TV |
НТВ плюс |
3000 |
Белый |
567001 |
|
Телевизор |
LG Z933 |
3000 |
Белый |
567001 |
|
DVD |
LG 2307 |
8000 |
Серый |
677021 |
|
Цифровой фотоаппарат |
Samsung Е46 |
8000 |
Серый |
677021 |
|