Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


«адачи кодировани€




¬изуальна€ информаци€, подлежаща€ обработке на Ё¬ћ, может вводитьс€ в запоминающее устройство со специального датчика (устройства ввода) или представл€ть собой результат некоторых вычислений. ¬ том и другом случае така€ информаци€ сопоставл€етс€ с некоторой картиной, зрительно воспринимаемой человеком. Ёто сопоставление по сути и €вл€етс€ принципиальным отличием визуальной информации от числовой, логической, символьной или какой-либо другой, котора€ может быть представлена в пам€ти Ё¬ћ [4].

ќчевидно, что визуальна€ информаци€ должна с определенной степенью точности отражать состо€ние €ркости или прозрачности каждой точки зрительно воспринимаемой картины. ƒл€ простоты в дальнейшем будем рассматривать только плоские картины. „тобы представить визуальную информацию в цифровой форме, необходимо дискретизировать пространство (плоскость) и проквантовать значение €ркости в каждой дискретной точке. Ќаиболее просто и естественно дискретизаци€ достигаетс€ с помощью координатной сетки, образованной лини€ми, параллельными ос€м х и у декартовой системы координат. ¬ каждом узле такой решетки делаетс€ отсчет €ркости или прозрачности носител€ зрительно воспринимаемой информации, котора€ затем квантуетс€ и представл€етс€ в пам€ти Ё¬ћ. –исунок 1 иллюстрирует процесс кодировани€ на примере изображени€ с четырьм€ градаци€ми €ркости.

a) b)
–ис. 1.  одирование визуальной информации: а - исходное изображение; б - его рецепторное представление.

–езультат представлен на рис. 1, б в виде матрицы, элементами аij которой служат отсчеты в узлах решетки.

“акое представление визуальной информации называетс€ рецепторным [3], естественным [1], поэлементным или матричным [2]. ќно заслуживает внимани€ хот€ бы потому, что наиболее удобно описывает процессы ввода и вывода изображений и позвол€ет легко установить однозначное соответствие между картиной и ее представлением в пам€ти Ё¬ћ. Ўирокий класс датчиков, используемых дл€ ввода оптической информации в Ё¬ћ, представл€ет собой набор светочувствительных элементов (рецепторов), преобразующих световой сигнал в электрический. ¬ процессе ввода рецепторы, расположенные в узлах рецепторной сетки, опрашиваютс€ в определенной последовательности и снимаемые с них сигналы преобразуютс€ в цифровую форму. “аким образом получаетс€ последовательность отсчетов в узлах координатной сетки. Ќапример, при использовании телевизионных датчиков, информаци€, содержаща€с€ в телевизионном кадре, считываетс€ построчно, т. е. отсчеты во времени образуют следующую последовательность:

где aij - элемент матрицы отсчетов, расположенный на пересечении i -й строки и j -го столбца; m - число строк матрицы, соответствующее числу строк в кадре; n - число столбцов матрицы, соответствующее числу элементов в строке.

ѕри использовании других датчиков (например, твердотельных) отсчеты могут выдаватьс€ в иной последовательности. ¬о всех случа€х поэлементный способ представлени€ изображений находит применение в качестве промежуточного при считывании визуальной информации. Ётот способ удобно использовать и при отображении информации на видеоконтрольных устройствах. ¬ св€зи с этим задачу кодировани€ визуальной информации будем рассматривать как задачу преобразовани€ естественной формы представлени€ в форму, удобную дл€ хранени€ и обработки в Ё¬ћ.

”читыва€, что люба€ обработка информации может рассматриватьс€ как ее перекодирование, будем отличать первичные, или абсолютные, кодовые описани€ от вторичных, или относительных [1]. Ќе дава€ строгих определений, укажем лишь на два существенных отличи€ таких кодовых описаний. ¬о-первых, первичные способы представлени€ в отличие от вторичных должны быть универсальными, т. е. допускать возможность восстановлени€ соответствующего изображени€ с точностью, определ€емой параметрами рецепторной решетки и числом   уровней квантовани€, и не учитывать специфику вводимых изображений или дальнейших алгоритмов их обработки. ¬о-вторых, первичное представление можно достаточно просто получить из естественного так, чтобы перекодирование осуществл€лось относительно простыми устройствами в процессе ввода информации в Ё¬ћ. ѕримером первичного описани€ визуальной информации служит ее поэлементное кодирование. ¬торичные способы представлени€ информации могут существенно отличатьс€ от первичных (или естественного) и получатьс€ в результате достаточно сложных алгоритмов обработки визуальной информации. Ќапример, можно предложить весьма компактные способы представлени€ принципиальных электрических схем, основанные на перечислении элементов, встречающихс€ в схеме, с указанием мест расположени€ на чертеже самих элементов и соедин€ющих их линий. ¬ качестве примера вторичного описани€ можно привести описание изображени€ в некотором пространстве признаков, используемых в дальнейшем дл€ распознавани€ образов.

ƒл€ того чтобы далее формализовать задачу кодировани€, удобно более четко выделить структурные единицы визуальной информации. Ќазовем всю подлежащую записи в Ё¬ћ визуальную информацию картиной или сценой. Ѕудем предполагать, что она представлена в естественной форме. Ќа размеры картины никаких ограничений не накладываетс€. ¬ частном случае ее размеры могут превышать размеры рецепторного пол€ оптического датчика, используемого дл€ ввода информации в Ё¬ћ. ¬ этом случае картина разбиваетс€ на пр€моугольные области, называемые растрами или кадрами (рис. 2).

–ис. 2. —труктурные единицы машинного представлени€ визуальной информации

 аждый растр по размерам соответствует рецепторному полю датчика и содержит mxn отсчетов, образующих пр€моугольную матрицу, состо€щую из m строк и п столбцов.  аждый отсчет характеризуетс€ числом   уровней квантовани€ видеосигнала. ќбычно полагают K =2 k, где k - целое. »ногда выдел€ют еще одну структурную единицу информации - поле. ѕоле - это часть кадра, образованна€ несколькими соседними отсчетами. ѕараметры m, n и k выбирают в зависимости от требуемой точности представлени€ информации с учетом возможностей оптического датчика. Ќапример, если в качестве такого датчика используют телекамеру, работающую в стандартном режиме, число строк и столбцов растра обычно измен€етс€ в пределах от 256 до 512, а число различимых уровней серого не превышает 256 (k 8).

¬ общем случае дл€ поэлементной записи кадра требуетс€ пам€ть, содержаща€

(2)

бит информации. ≈сли оценить W, то можно убедитьс€ в том, что дл€ поэлементного представлени€ кадра требуетс€ значительный объем пам€ти. Ќапример, пусть m=n =256 и k =6. ¬ этом случае W =6Ј216. ѕри определении способа размещени€ информации в пам€ти Ё¬ћ необходимо учитывать тот факт, что пам€ть Ё¬ћ имеет словарную структуру, т. е. существует минимальное адресуемое слово фиксированной длины s. ¬ общем случае s не равно и не кратно k. «десь можно предложить два подхода к решению задачи размещени€ отсчетов в словах пам€ти Ё¬ћ.

¬ первом из них дл€ представлени€ визуальной информации используют все разр€ды всех слов выделенного массива. ¬ этом случае достигаетс€ наибольша€ компактность представлени€ и требуетс€ меньший объем пам€ти. ≈го оценка при поэлементном кодировании даетс€ формулой (2). ќднако такое размещение неудобно дл€ обработки информации, так как некоторые отсчеты оказываютс€ размещенными в нескольких словах. ѕри другом подходе каждый отсчет целиком представл€етс€ некоторым машинным словом. Ќо при этом в общем случае используютс€ не все разр€ды машинных слов, что приводит к увеличению требуемого объема пам€ти. Ќапример, если прин€ть подход, при котором каждый отсчет размещаетс€ в отдельном слове, то дл€ представлени€ одного кадра потребуетс€ mn машинных слов.

≈стественно сформулировать задачу кодировани€ как задачу получени€ такого представлени€ визуальной информации, которое занимает минимальный объем пам€ти Ё¬ћ и в то же врем€ удобно дл€ обработки. ѕрактическа€ значимость минимизации объема пам€ти становитс€ более очевидной, если учесть, что во многих случа€х требуетс€ анализировать картины значительных размеров, содержащие сотни, а может быть тыс€чи растров. „тобы получить какие-то численные оценки, рассмотрим реальный пример, в котором размеры обрабатываемой картины составл€ют 200x300 мм и каждый отсчет представл€етс€ словом, содержащим восемь двоичных разр€дов. ≈сли при этом шаг рецепторной сетки равен 0,1 мм, то потребуетс€ пам€ть пор€дка 6 ћбайт.

ќценим качество или эффективность кода средним количеством бит, приход€щихс€ на один отсчет:

(3)

где Wmn - объем пам€ти, требуемый дл€ представлени€ одного кадра размером mxn.

≈сли не учитывать возможные потери, обусловленные словарной организацией пам€ти, дл€ поэлементного способа кодировани€ в соответствии с (3) l=k. ѕредполага€, что требуемый при поэлементном кодировании объем пам€ти удаетс€ сократить, положим l max= k. ¬ведем в рассмотрение коэффициент сокращени€

(4)

характеризующий сокращение объема пам€ти по сравнению с по элементным кодированием.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-10-01; ћы поможем в написании ваших работ!; просмотров: 512 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќаглость Ц это ругатьс€ с преподавателем по поводу четверки, хот€ перед экзаменом уверен, что не знаешь даже на два. © Ќеизвестно
==> читать все изречени€...

1743 - | 1412 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.013 с.