Письма в

 Эмиссия.Оффлайн

2010

 The Emissia.Offline Letters           Электронное научное издание (научно-педагогический интернет-журнал)  

Издается с 7 ноября 1995 г.  Учредитель и издатель: Российский государственный педагогический университет им. А.И.Герцена. ISSN 1997-8588

ART 1435  

Июль 2010 г.

Мокрый Валерий Юрьевич
аспирант кафедры информатики, Российский государственный педагогический университет им. А.И.Герцена, Санкт-Петербург

av_and_mt@mail.ru

Учебный модуль  «Сжатие мультимедиа данных» как инструмент развития профессиональной компетентности будущих учителей информатики

Теория сжатия данных является интегрированной областью, использующей аппарат смежных дисциплин, как математических, так и информационных (таких как цифровая обработка сигналов, теория алгоритмов, математический анализ, математическое моделирование).  Как самостоятельная, теория сжатия данных выделилась из теории информации в 50 – 70 годах прошлого века, когда начали разрабатываться первые алгоритмы сжатия данных. Сегодня область сжатия информации бурно развивается, улучшены классические алгоритмы, разработано много новых алгоритмов, которые применяются в самых разных информационных процессах. Алгоритмы сжатия широко используются   в области архивирования данных.

Анализ направлений исследований в области методики  обучения алгоритмам сжатия данных позволил выделить школы, в которых ведутся исследования в области алгоритмов сжатия данных и читаются соответствующие курсы. Цифровые образовательные ресурсы, адекватные этим курсам, представлены на сайтах Массачусетского технологического института, университетов в Дели,  Карапуре и других городах Индии, Московского Государственного университета и ряда других [1-4]. Как показал поисковый эксперимент, эти учебно-методические материалы сложны для усвоения бакалаврами и магистрами направления «Педагогическое образование»

Проблема, таким образом, состоит в том, чтобы адаптировать имеющиеся и разработать новые учебно-методические материалы по разделу «сжатие информации» для обучения студентов по направлению «Педагогическое образование» (бакалавров и магистров), с целью развития профессиональной компетентности будущих учителей информатики.    

Алгоритмы сжатия данных делятся на две большие категории – с потерями и без потерь. Как правило, без потерь обрабатывается текст, графика и изображение. Алгоритмы сжатия с потерями применяются для сжатия звука и видеоинформации. Среди  алгоритмов сжатия без потерь, в первую очередь, целесообразно выделить классические алгоритмы Хаффмана, арифметического и словарного кодирования (LZ77, LZ78). Ранее считалось, что перечисленные типы алгоритмов подходят для сжатия данных любой природы, однако позднее выяснилось, что для каждого типа информации (текста, звука, видео и графики) необходимы более совершенные алгоритмы сжатия. В настоящий момент широко используются следующие алгоритмы сжатия графических данных: алгоритм сжатия JPEG, вейвлет-преобразования и фрактальное сжатие.  

В стандартах третьего поколения, разработанных для бакалавров и магистров направления «Педагогическое образование» [5,6], указаны  компетенции, которыми должен обладать выпускник вуза. Учитывая содержание стандарта, нами разрабатывается система модулей, ориентированных на различные группы студентов. Ниже приводится вклад в основные компетенции, которыми должен будет обладать студент, прошедший обучение по модулю «Сжатие мультимедиа данных»:

1.  Общекультурные. Знать историю теории сжатия данных, эволюцию алгоритмов, имена ученых, внесших значительный вклад в развитие теории.

2.  Профессиональные. Здесь можно выделить три типа компетенций – в области алгоритмов, программ и методики.

2.1. Алгоритмизация: знать принципы сжатия данных, основные алгоритмы сжатия; уметь выполнять кодирование и декодирование сообщений с использованием алгоритмов сжатия Хаффмана, арифметического и словарного кодирования, а также использовать преобразования, лежащие в основе более сложных алгоритмов сжатия (звука, графики и видео); уметь выполнять подсчет основных характеристик алгоритмов – степень и качество сжатия, а также метрики, используемые для оценки кодирования в алгоритмах сжатия мультимедиа данных; владеть аппаратом теории информации и сжатия данных для выполнения исследовательских задач.

2.2. Программная составляющая: иметь представление о способах программной реализации алгоритмов сжатия в средах Borland Delphi, C++ Builder и Matlab; знать этапы реализации изученных алгоритмов сжатия в выбранной системе программирования; владеть принципами реализации алгоритмов сжатия данных в той или иной системе программирования.

2.3. Методическая составляющая: уметь использовать полученные знания, умения и навыки для разработки уроков для школьников и при выполнении своих квалификационных работ.

Апробация материалов работы осуществлялась при проведении занятий для бакалавров и магистров факультета математики РГПУ имени А.И.Герцена, обучающихся на кафедре информатики и студентов факультета информационных технологий РГПУ имени А.И.Герцена.

Примерный расчет времени на обучение алгоритмам сжатия текстовых данных включал:

  1. Вводное занятие – классификация алгоритмов сжатия  - 2 часа

  2. Алгоритм Хаффмана                                                                   - 2 часа

  3. Алгоритм арифметического кодирования                            - 2 часа

  4. Контрольное занятие                                                                 - 2 часа

  5. Словарные алгоритмы сжатия данных                                 - 2 часа

  6. Решение задач по алгоритмам                                               - 4 часа.

Обучение включало лекции, практические и контрольные занятия по темам, перечисленным выше. Для отдельных категорий студентов контроль проводился в виде тестов.  Во всех группах студентов проводилось анкетирование. Была предусмотрена самостоятельная работа, содержание которой было нацелено на рассмотрение современных версий изученных алгоритмов. Студентам предлагались как задания, выполняемые в ходе  лекций и практических занятиях, так и задания для самостоятельного решения. Задания, которые рассматривались на лекциях и на практических занятиях предназначались для развития компетенции в области алгоритмизации:

  • Закодировать фразу определенной длины с использованием изучаемого алгоритма, посчитать показатели степени сжатия, качества сжатия. Посчитать энтропию, среднюю длину кодовых слов и избыточность кодирования (для алгоритмов Хаффмана и арифметического кодирования).

  • При рассмотрении алгоритма арифметического кодирования необходимо  закодировать фразу, порожденную источником с определенным распределением вероятностей.

  • Выполнить декодирование по тому или иному алгоритму.

  • Решение задачи на кодирование по словарным алгоритмам (LZ77, LZ78), в процессе решения которой необходимо построить кодовое дерево, отражающее структуру сообщения.

На практических занятиях студенты объясняли решения задачи у доски, что является развитием еще одной профессиональной компетенции – методической, так как объяснение алгоритма вызывает больше трудностей, чем его понимание.

Апробация материалов показала, что для развития профессиональных компетенций необходимо добавить задания, направленные на развитие компетенции в программировании –  реализация того или иного алгоритма,  работа с кодом алгоритма в той или иной системе программирования, анализ текста программы.

Ниже приведен обзор полученных результатов апробации модуля «Сжатие мультимедиа данных». Занятия проводились для следующих категорий студентов РГПУ им. А.И.Герцена:

  • Бакалавры физико-математического образования (3-й и 4-й курсы).

  • Магистры физико-математического образования (1-й курс).

  • Магистры факультета информационных технологий в образовании (ФИТО).

  • Студенты 4-го курса факультета информационных технологий в образовании (инженеры).

В 2009-2010 учебном году занятия проводились для студентов 4-го курса факультета информационных технологий (инженеры). Были рассмотрены две темы:

  • Алгоритмы сжатия текстов Хаффмана и арифметического кодирования.

  • Алгоритмы словарного сжатия (LZ77 и LZ78 – в аудиториях и LZSS и LZW самостоятельно).

По каждой теме  проводилась контрольная работа. На гистограмме (рис.1), отражено распределение результатов выполнения заданий по теме «Алгоритм Хаффмана и арифметического кодирования». 

 

  Рис.1. Распределение оценок в результате выполнения контрольной работы по теме «Алгоритм Хаффмана и арифметического кодирования».

Из гистограммы можно сделать вывод, что с кодированием по алгоритму Хаффмана справилось большинство студентов, в то время как выполнение заданий по арифметическому кодированию вызвало больше трудностей, особенно декодирование. Это можно объяснить тем, что алгоритм Хаффмана более прост в освоении, чем алгоритм арифметического кодирования. Ошибки допускались и при решении заданий по алгоритмам словарного кодирования, поскольку здесь применяется другая техника кодирования. Ошибки были связаны либо с неточностью в расчетах либо с непониманием материала.

Для группы, в которой проводились две контрольные работы по двум рассмотренным типам алгоритмов, проводился расчет коэффициента корреляции Пирсона (r) между результатами выполнения заданий по теме «Алгоритм Хаффмана и арифметического кодирования» и теме «Алгоритмы словарного кодирования».  При проведении расчета использовалась трехуровневая шкала оценки (0, 0.5, 1) полученной каждым студентом за каждое из двух заданий.

Коэффициент корреляции в тестируемой группе оказался равным r = 0.446633 (при критическом значении 0.40 и уровне значимости 0.10 [7]). Как известно, в литературе выделяют следующие типы корреляционной связи [7]:

  • прямая (при положительных значениях коэффициента корреляции),

  • обратная (при отрицательных значениях коэффициента корреляции),

и далее, в зависимости от абсолютных значений коэффициента корреляции r:

  • cильная, или тесная при r>0,70;

  • средняя при 0,50<r<0,69;

  • умеренная при 0,30<r<0,49;

  • слабая при 0,20<r<0,29;

  • очень слабая при r<0,19.

Рассчитанный коэффициент r = 0,446633, лежит в интервале 0,30<r<0,49. Поэтому связь между результатами выполнения контрольных работ по двум темам - прямая умеренная.

В тестируемых группах проводилось также анкетирование, которое позволило определить заинтересованность студентов в изучении того или иного алгоритма сжатия. Ответы различались в зависимости от категории студентов. Так, студенты факультета информационных технологий проявили повышенный интерес к изучению алгоритмов сжатия графической информации (JPEG и GIF), сжатию видеоинформации (H.264, MPEG), алгоритмам словарного сжатия. Студенты факультета математики интересовались алгоритмами сжатия, лежащими в основе архиваторов WinRAR и WinZip, квантовыми алгоритмами сжатия.

Это указывает на то, что в процессе подготовки специалистов в области «Педагогическое образование» (информационные технологии) целесообразно организовать изучение алгоритмов сжатия работающих с основными типами данных, причем организовать это изучение в виде курса по выбору для студентов факультетов информационных технологий и кафедры информатики факультета математики.

Литература 

  1. Massachusetts Institute of Technology. OpenCourseWare [электронный ресурс] // URL: http://ocw.mit.edu. (дата обращения 20.07.2010).

  2. Massachusetts Institute of Technology. [электронный ресурс] // URL: http://mit.edu. (дата обращения 20.07.2010).

  3. National Programme on Technology Enhanced Learning. India. [электронный ресурс] // URL: http://nptel.iitm.ac.in.  (дата обращения 11.06.2010).

  4. Курсы лаборатории компьютерной графики ВМИК МГУ. [электронный ресурс] //  URL: http://courses.graphicon.ru/main/. (дата обращения 20.07.2010).

  5. Основная образовательная программа высшего профессионального образования, информатика и информационные системы. Направление – педагогическое образование. Очная форма обучения. Квалификация (степень) бакалавр. - СПб, РГПУ, 2009.

  6. Основная образовательная программа высшего профессионального образования, информационные технологии в инновационном образовании. Направление – педагогическое образование. Очная форма обучения. Квалификация (степень) магистр. – СПб.,  РГПУ, 2009.

  7. Применение статистических методов в гуманитарных исследованиях. Украина. [электронный ресурс] // URL: http://psystat.at.ua. (дата обращения 18.05.2010).

Рекомендовано к публикации:  
И.В.Симонова, доктор педагогических наук, научный руководитель работы
  
А.А.Ахаян , доктор педагогических наук, член Редакционной Коллегии


Copyright (C) 2010, Письма в Эмиссия.Оффлайн (The Emissia.Offline Letters) 
ISSN 1997-8588. Гос. регистрация во ФГУП НТЦ "Информрегистр" Мин. связи и информатизации РФ на 20
10 г. № 0421000031
Свидетельство о регистрации СМИ Эл № ФС77-33379 (000863) от 02.10.2008 от Федеральной службы по надзору в сфере связи и массовых коммуникаций
При перепечатке и цитировании просим ссылаться на " Письма в Эмиссия.Оффлайн
".
Эл.почтаemissia@mail.ru  Internet: http://www.emissia.org/  Тел.: +7-812-9817711, +7-904-3301873
Адрес редакции: 191186, Санкт-Петербург, наб. р. Мойки, 48, РГПУ им. А.И.Герцена, корп.11, к.24а

Рейтинг@Mail.ru

    Rambler's Top100