Выпуски

Том 13 №1

Информационный анализ делового текста. Стратегии анализа и компоненты анализатора
Аннотация: Статья посвящена обсуждению общей архитектуры систем информационного анализа делового текста. Обсуждаются три комплекса проблем, решения по которым радикально меняют архитектуру анализатора: определение целевой технологии и с учетом этого выбор целевого языка представления знаний; выбор способа межуровневого взаимодействия компонентов анализатора; определение соотношения структурных (rule-based) и прецедентно-статистических (example-based, case-based, corpus-based) моделей в используемых алгоритмах и процедурах анализа.
Об опыте создания системы управления коллекциями графических документов
Аннотация: Статья посвящена вопросам создания системы управления коллекциями графических документов. Мы описываем работу интерфейсов администратора и пользователя в разработанной системе, существующие и новые признаки изображений, и их использование в методах классификации и поиска, возникшие проблемы и методы их решения.

Том 13 №2

Методы оценки пространственных характеристик сельских поселений Карелии
Аннотация: Статья посвящена описанию разработанной модели, предназначенной для расчета продолжительности инсоляции помещений и алгоритма выделения построек на карте. Данная модель и алгоритм были реализованы в программной системе, предназначенной для проведения историко-архитектурного анализа объемно-планировочной структуры традиционных сельских поселений Русского Севера.
Особенности создания электронного ресурса "материалы к синтаксическому словарю"
Аннотация: В статье описывается размеченный корпус текстов публицистики XIX века в оригинальной графике (http://smalt.karelia.ru/corpus/index.phtml), обосновывается выбор теории и параметров разметки, обсуждаются некоторые сложности аннотирования. Основу корпуса составляют тексты В. И. Даля, Ф. М. Достоевского и близких ему публицистов.

Том 13 №3

Российская виртуальная обсерватория - национальный сегмент Международной виртуальной обсерватории
Аннотация: Традиционный путь открытий астрономических объектов подразумевает изобретение, создание и использование новых телескопов и наблюдательных методов. C созданием Виртуальной  Обсерватории (ВО) появилась возможность  изменить эту схему, поскольку для новых открытий используются  уже существующие данные из архивов и каталогов. Основная цель создания ВО это предоставить возможность пользователям использовать данные, полученные когда-либо, с любого телескопа в мире на любой компьютер в любое время.
Международная виртуальная обсерватория: десять лет спустя
Аннотация: Международная виртуальная обсерватория представляет собой реализацию концепции электронной науки в астрономии. Это мощная виртуальная среда, предназначенная для увеличения возможностей астрономических исследований и научного выхода данных. Виртуальная обсерватория интегрирует в единую среду гигантские астрономические архивы и базы данных, распределенные по всему миру, а также инструменты анализа данных и вычислительный сервис, используя при этом набор однородных стандартов и технологий. Международная виртуальная обсерватория объединяет все значительные национальные и международные проекты по созданию виртуальных обсерваторий, основная цель которых – объединить существующие архивы наземных и космических инструментов и обеспечить исследователям и общественности удобный доступ к ним. Эта задача представляется весьма значительной не только из-за колоссального объема астрономических данных, но и их спектрального разнообразия (от рентгена до радио). Каждый спектральный диапазон предоставляет свою, уникальную информацию о небесном объекте или явлении; при этом требуется специализированная экспертиза для правильной интерпретации. Вся эта информация также интегрируется в Международной виртуальной обсерватории и позволяет синтезировать данные, чтобы использовать их в конкретных научных приложениях.

Том 13 №4

Электронный архив наблюдательных данных астрофизической обсерватории
Аннотация: Архивная система обсерватории включает в себя хранилище цифровых данных и информационно-поисковую систему (ИПС) с динамическим веб-интерфейсом и http-доступом. На текущий момент в систему включены 16 цифровых коллекций наблюдательных данных (локальных архивов), полученных на разных приборах, работающих или работавших на телескопах обсерватории. Самые ранние данные относятся к концу 1994 года. В настоящее время активно пополняются 6 локальных архивов. Хранилище данных включает область временного хранения, расположенную на файл-сервере БТА, и область постоянного хранения. Область постоянного хранения это - CD/DVD-диски, жесткий диск выделенного архивного сервера и USB-диск большой емкости. Для сохранности данных при аварийных ситуациях и при возникающих дефектах носителей мы обеспечиваем хранение 2 полных копий на CD/DVD?дисках и двух копий архива на винчестере. Одна копия (A0) повторяет оптические диски, другая (A1), несколько по структуре каталогов модифицированная, используется ИПС. Цифровые носители и устройства чтения-записи данных нельзя отнести к устройствам длительного хранения, поэтому при долговременном хранении цифровых данных необходимо обеспечивать перенос информации на новый тип носителей каждые 5-10 лет. Копии архива A0 и A1 поддерживаются и для этой процедуры переписывания. Вариант архивных данных (A1) повторен на USB-диске с добавлением дампа таблиц и программ. Это резервная копия для восстановления информационной системы при аварийной ситуации на сервере. Для обеспечения модернизации ИПС мы поддерживаем две схемы базы данных — тестовую и рабочую. Разработки ведутся на тестовой схеме. При модификациях схемы после проведенного тестирования ИПС переключается на обновленную версию БД. Оригинальная копия A0 и наличие тестовой схемы позволяют выполнять модернизацию ИПС даже на уровне схемы таблиц. В настоящее время ИПС реализована на СУБД PostgreSQL 8.3.7.
Методы виртуальной обсерватории в задаче оптического отождествления радиоисточников
Аннотация: Массовое отождествление списка радиоисточников по данным обзоров неба разных диапазонов электромагнитного спектра представляет для астрономов несомненный интерес. Отождествление радиоисточников не является простой задачей из-за разного углового разрешения, предельной чувствительности, координатной точности радиокаталогов, а также из-за морфологической структуры самих радиоисточников. Нами был разработан подход к массовому отождествлению радиоисточников каталога RC, полученного на крупнейшем российском радиотелескопе РАТАН-600, с использованием веб-сервисов, обеспечивающих доступ, визуализацию и анализ данных из оптических, инфракрасных и радио обзоров, которые являются ресурсами виртуальной обсерватории. Около 25% радиоисточников каталога RC не были подтверждены в обзоре NVSS, поэтому для уточнения координат и плотностей потоков была проведена повторная обработка данных обзоров “Холод” за 1980-1999 гг., результатом которой стал каталог RC Refined (RCR). Средствами интерактивного атласа неба Aladin (Perl API для командного интерфейса и макроконтроллер), а также с помощью pysao (программный Python-интерфейс к SAOImage DS9) реализованы потоки работ по списку радиоисточников для подготовки данных и визуализации результатов. Радиоисточники каталога RCR были отождествлены с данными 5 радиообзоров неба: VLSS, TXS, NVSS, FIRST, GB6 (частоты 74, 365, 1440 и 4850 МГц), двух оптических обзоров: DSS2 и SDSS (полосы u,g,r,i,z) и инфракрасного обзора UKIDSS (полосы J, H, K). Поскольку предполагается дальнейший анализ многочастотных данных, особое внимание уделено компиляции разнородной информации в один ресурс, информационно-поисковую систему ObjectRadioSky. Для этого разработана схема базы данных, учитывающая добавление новых каталогов, интеграцию их параметров с UCDs и реализацию связи между объектами каталогов. Реализован веб-интерфейс для отображения всей имеющейся информации о выбранном радиоисточнике.