Разумное. Доброе. Вечное.

AAA
Обычный Черный

Рекомендованное

Опрос

Навигация

Стих дня

Всякая поэзия есть выражение душевного состояния.
© Бергсон А.

17 октября

Об инструментах

нам очень любопытно петыр
так расскажите ж нам зачем
вы вбили гвоздь в кирпич и главно
е чем

Новости культуры от Яндекса



Кто не делится найденным, подобен свету в дупле секвойи (древняя индейская пословица)


Управление жизненным циклом информации

Виды информации

Все многообразие окружающей нас информации группируют по различным признакам.

По признаку «область возникновения» информация, отражающая процессы, явления неодушевленной природы называется элементарной или механической, животного и растительного мира - биологической, человеческого общества - социальной.

По способу передачи и восприятия различают информацию, передаваемую:

- видимыми образами и символами - визуальную;

- звуками - аудиальную;

- ощущениями - тактильную;

- запахами и вкусами - органолептическую;

  • информацию, выдаваемую и воспринимаемую средствами вычислительной техники, - машинную.

Информацию, создаваемую и используемую человеком, по общественному назначению делят на три вида:

  1. - личную, предназначаемую для конкретного человека;
  2. - массовую, предназначаемую для любого, желающего ею пользоваться (общественно-политическая, научно-популярная);
  3. - специальную, предназначаемую для использования узким кругом лиц, занимающихся решением сложных социальных задач в области науки, техники, экономики.

В зависимости от области знаний различают научную, техническую производственную, правовую, патентную и иную информацию. Каждый вид информации имеет свои особые смысловые нагрузки и ценности, свои требования к ее точности и достоверности, преимущественные технологии обработки, формы представления и носители.

Формы представления информации

В роли источников и приемников информации могут выступать самые разнообразные объекты науки и техники, общества и природы. Разнообразие источников и потребителей информации привело к существованию различных форм ее представления. Основные из них — символьная (основанная на использовании символов: букв, цифр, знаков); текстовая (использует тексты, т.е. символы, расположенные в определенном порядке); графическая (различные виды изображений), звуковая.

Символьная форма - является наиболее простой, но практически она применяется только для передачи несложных сигналов о различных событиях. Примером может служить разный свет светофора, сообщающий о возможности начала или прекращения движения пешеходам или водителям автотранспорта; милицейский свисток, который дает информацию о действиях, которые должен предпринять человек, которому «адресован» этот звуковой сигнал и т.д.

Текстовая форма представления информации является более сложной. Она также использует различные символы: буквы, цифры, математические знаки. Но информация заложена не только в этих символах, но и в их сочетании, в порядке следования. Так, слова «кот» и «ток» состоят из одинакового количества одинаковых букв, но содержат различную информацию. Благодаря тому, что текстовая информация является изображением речи, она чрезвычайно удобна и широко используется (книги, журналы, газеты, различные документы, аудиозаписи).

Графическая форма представления информации является наиболее сложной. Сюда относятся фотографии, схемы, рисунки, чертежи, имеющие большое значение в деятельности человека.

Жизненный цикл информации

Информационный поток – информация, рассматриваемая в процессе ее движения в пространстве и времени в определенном направлении.

Информационные потоки упорядочиваются для:

  • совершенствования организационной структуры управления процессом обмена информацией;

  • оптимизации информационных процессов в фармации с целью повышения качества и эффективности работы;

  • автоматизации процессов получения, сбора, хранения, поиска, передачи и использования информации.

Данные - рассматриваются как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. Если данные участвуют в процессе снятия неопределенности, то данные становятся информацией.

Знания - совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача

Знания – это зафиксированная и проверенная практикой информация, которая может многократно использоваться людьми для решения тех или иных задач. Функции, объединяющие такие базовые понятия, как «данные», «информация», «знания» и «мудрость», формируют жизненный цикл информации.

Для довольно многочисленного класса научно-технической документации оригинальный документ как основа ее информа­ционной деятельности может оказаться ее началом и после ка­кого-то жизненного цикла — концом. В результате информаци­онной деятельности (в широком смысле слова) документы соз­даются, компонуются, разыскиваются и т. д. Важно заметить,

что в результате информационной деятельности документ (ори- гинальный документ, первоисточник, например, статья, жур­нал) постепенно теряет свое значение.

Этот процесс происходит по разным причинам — ввиду ли­бо физического или морального старения первоисточника, ли­бо слишком широкого использования. Пользователь легко при­выкает к копиям: однако же только активно используемый до­кумент имеет общественную значимость. Утрате интереса к оригиналу способствует и хорошее аннотирование (рефериро­вание), которое приводит к тому, что 95% полнотекстовых до­кументов уже не востребованы, и плохое.

Особенно активно этот процесс пойдет с внедрением элек­тронных документов, которые очень технологичны, гибки в об­работке, волатильны (легко меняют свое значение). Они легко поддаются фильтрации, извлечению содержательных частей, слиянию. В результате может оказаться, что в научно-техниче­ской литературе значение оригинала существенно исказиться — за оригинальным документом останутся только исторические, авторские функции, а познавательные перейдут к стрингам — линейным цепочкам полезных фактов и точных сведений.

Пугаться этого нечего, ибо, например, учебники построены именно по такому принципу. Непривычно лишь то. что написа­ние и отработка учебника занимает много лет, а переделка элек­тронного текста может произойти «налету», за несколько долей секунды. Что касается документов других классов, то чаше всего их ценность со временем только возрастает.

Хорошим примером переделки документов «на лету» явля­ется транслитерация элементов библиографических записей: например, запись существует на русском языке, а пользователь из США в режиме просмотра выбирает опцию «транслитериро­вать» и тут же получает на экране своего монитора эту же запись в латинских символах (встроенная функция транслитерации по запросу).

Управление жизненным циклом информации

ILM (управление жизненным циклом информации) — это на сегодня одна из самых «горячих» концепций хранения данных, которая начала складываться всего лишь несколько лет тому назад и не привязана к какому-то одному продукту, категории или семейству продуктов. Скорее, это подход к управлению хранимыми данными на более эффективной и экономичной основе при помощи определенной стратегии, гарантирующей, что инфраструктура хранения в организации согласована с задачами.

Управление жизненным циклом информации начинается с оценки и классификации имеющейся информации и ресурсов для ее хранения с точки зрения их бизнес-ценности. Первые два шага должна сделать любая организация, которая решила управлять своей информацией на основе ее жизненного цикла, а именно: определить цели управления информацией и классифицировать свою информацию на основе ее ценности для бизнеса. 

Необходимость в управлении жизненным циклом информации связана не только с управлением контентом (управление записями, управление документами и другие подобные задачи); она обусловлена и требованием управления все возрастающими объемами данных, и обеспечением соответствия нормативам, отражающим изменившуюся роль машинных форм представления данных в современном мире.

Функции ILM не ограничиваются только управлением хранением данных на определенных носителях. Требуется еще решать задачи интеллектуального управления потоками работ и бизнес-процессами, которые задействуют на эти данные. ILM управляет информацией на основе изменяющихся с течением времени критериев ее значимости для бизнес-процессов и потребностей приложений. Жизненный цикл данных начинается с момента их создания в различных системах, таких как электронная почта, ERP, СУБД, финансовые приложения, системы обработки изображений и др. Затем под управлением ILM реализуются процессы доступа, распределения, защиты, хранения и ликвидации данных. ILM позволяет задавать политики для такого управления, в которых специфицируются параметры качества сервиса данных: доступность, защищенность, скорость восстановления, производительность, местонахождение носителя и стоимость хранения.

Для того чтобы реализовать перечисленные задачи, ILM следует базировать на инфраструктуре хранения, включающей устройства разных классов, использовать программный инструментарий управления хранением и увязывать между собой задачи управления инфраструктурой хранения и потребности бизнес-приложений по размещению, использованию, хранению и миграции данных. Требуется отслеживать время нахождения конкретного информационного объекта на определенном уровне, частоту его использования, объем, возраст, легальность доступа и т.п., одновременно соизмеряя полученные данные с требуемыми параметрами стоимости, целесообразности хранения на том или ином уровне и адекватности SLA. Процессы миграции инициируются после анализа текущего состояния информационного объекта, либо по событию извне, например, в соответствии с политиками, задающими пороговые значения параметров.

Содержание политик определяют внешние критерии, формируемые бизнесом:

  • необходимый объем информации, требуемый для принятия решения;
  • состав SLA;
  • разграничение прав доступа и т.п.

Первый критерий определяется бизнес-логикой и часто не поддается формализации, а получается, например, на основе рекомендаций консультантов. Как только определен объем информации, определяются требования по ее защите. Показатель RPO (Recovery Point Objectives) специфицирует критическую массу информации, которая может быть утеряна при фатальных событиях без нарушения бизнеса (как много транзакций может быть потеряно). В некоторых случаях (для банков) это значение равно нулю, но для промышленности потери нескольких транзакций могут быть не столь критичны. Показатель RTO (Recovery Time Objectives) определяет время простоя системы от момента возникновения нарушения до восстановления работоспособности. Обычно это время, необходимое для перезагрузки и отката на предыдущее состояние. Ясно, что когда речь идет о нескольких терабайтах данных, то на их восстановление могут уйти часы и даже дни. Применительно к ILM соглашения об уровне обслуживания могут означать, например, гарантированное время доступа к информационному объекту. Права доступа зависят от требований к управлению и целостности данных. Например, требуется обеспечить доступ только внутри компании, или необходимо обеспечить возможность обращения к документации со стороны внешних партнеров. При каждой миграции данных с одного уровня на другой средства ILM должны согласовывать свои действия с этими требованиями, например, сохранив возможность доступа к редко используемому в последнее время документу из офиса, после его перемещения в архив. Согласно практике работы с информацией, в ILM выделяют три уровня организации информационных объектов.

Том. Это базовый уровень, своего рода контейнер с данными, над которым система хранения осуществляет те или иные операции. Том имеет свой идентификатор — LUN (Logical Unit Number), позволяющий параллельно обрабатывать данные независимо от их физического размещения, создавать копии, хранить информацию о виртуальных носителях, осуществлять мониторинг текущего состояния информационного объекта и т.п. С точки зрения приложения любые перемещения LUN с одного носителя на другой должны быть прозрачны — логический адрес объекта остается неизменным.

Файловая система. Информационными объектами файловой системы или базы данных являются файлы, каталоги, узлы, таблицы, метаданные. Как и для базового уровня, объекты файловой системы с точки зрения приложений должны быть нейтральны к конкретной физической реализации. Для этого служит пул метаинформации, позволяющей виртуализировать файловую систему, однако сегодня еще невозможно прямое обращение к классам хранения (логическая структуризация) и осуществляется непрямая табличная адресация. Поэтому, в частности, атрибуты процессов в ILM вычисляются через таблицу указателей.

Приложения. Реальные проблемы в ILM кроются не в процессах создания или размещения данных на хранение, а при обеспечении приложениям доступа к информационным объектам с соблюдением нормативов по срокам хранения, SLA, целостности и безопасности. К примеру, сообщения электронной почты могут содержать конфиденциальную информацию о начислении налогов, которые согласно определенным нормам должны иметь как свой конкретный срок хранения, так и степень защищенности. Приложения, отвечающие за архивирование и удаление данных должны учитывать эти моменты.

Все три уровня информационной структуры могут жить только вместе, что требует специального сервиса по интеграции. Скажем, физическая файловая система связана с виртуальными томами, задействованными в LUN — любое расширение файловой системы влечет за собой череду логических шагов по изменению метаданных. Другой пример — электронная почта. Конкретное послание может быть удалено с почтового сервера, однако если согласно политикам срок действия соответствующей информации еще не закончился, система архивирования сохранит это сообщение в своей базе — данный процесс выполняется на уровне приложений, но сама база перемещается на более медленный физический носитель — уровень файловой системы

90
26.08.2017 г.

Яндекс.Метрика
Рейтинг@Mail.ru


Индекс цитирования

Уважаемые посетители! С болью в сердце сообщаем вам, что этот сайт собирает метаданные пользователя (cookie, данные об IP-адресе и местоположении). И как ни прискорбно это признавать, но это необходимо для функционирования сайта и поддержания его жизнедеятельности.

Если вы никак, ни под каким предлогом и ни за какие коврижки не хотите предоставлять эти данные для обработки, - пожалуйста, покиньте сайт и забудьте о нём, как о кошмарном сне. Всем остальным - добра и печенек. С неизменной заботой, администрация сайта.