Читать в оригинале

<< Предыдущая Оглавление Следующая >>


1.5. Подготовка данных

Под подготовкой данных подразумевается процесс получе­ния (сбора) данных об изучаемом явлении. Существует ряд ме­тодов получения исходных данных. В некоторых случаях ис­ходные данные содержатся в существующей документации, и тогда задачей исследователя является выявление требуемых данных и организация доступа к ним. В других случаях подго­товка данных может включать анкетирование, обзор проблема­тики или же физическое экспериментирование.

В крупномасштабных моделях, таких, как модели городских (или экономических) систем, требуемые данные обычно можно получить из существующей документации. Источниками данных для таких моделей служат, например, официальные отчеты, ста­тистические сборники, а также материалы правительственных и международных организаций. Все чаще подобные материалы не только появляются в виде бумажных документов, но записы­ваются и на машинные носители информации (например, на магнитную ленту или гибкий диск).

Для моделей производственных систем важным источником данных может служить финансовая и техническая документа­ция. Хотя эта документация часто недостаточна при формиро­вании целостной основы для оценки спроса, стоимости продук­ции и других важных факторов, она тем не менее служит от­правной точкой при моделировании. Анкетирование и обзор предметной области также являются одними из возможных ме­тодов получения данных при моделировании производственной деятельности.

Физическое экспериментирование, как правило, является наиболее дорогостоящим и трудоемким методом получения ис­ходных данных. Оно включает в себя измерение, запись и об­работку данных. Особое внимание здесь следует уделять пла­нированию эксперимента, которое позволяет убедиться в пред­ставительности условий эксперимента и правильности записы­ваемых данных.

В ряде случаев исходных данных может не существовать, при этом сама природа моделируемой системы часто исключа­ет возможность экспериментирования. Примером такой ситуа­ции может служить имитационное моделирование различных вариантов размещения оборудования сборочной линии. Воз­можным подходом к подготовке данных в таких случаях может быть предварительный синтез данных [2], который пред­полагает вычисление оценок продолжительности работ с ис­пользованием таблиц стандартных исходных данных. Таким образом, этот метод позволяет оценивать продолжительность выполнения работ еще до того, как они будут выполняться в действительности.

Группировка данных. Одним из методов преобразования данных к удобному виду является группировка данных по клас­сам (интервалам). Данные затем сводятся в таблицу, содержа­щую количество попаданий элементов данных в каждый класс. Такая таблица называется частотной и обычно дает хорошее общее представление о данных. Примером частотной таблицы могут служить представленные ниже данные о временах ожи­дания обслуживания посетителями:

Время ожидания, с

Число посетителей

0  - 20

21

20 - 40

35

40 - 60

42

60 - 80

35

80  - 100

19

100 - 120

10

       > 120

10

Числа в правом столбце таблицы указывают количество по­павших в каждый класс посетителей и называются частотами классов. Числа в левом столбце для каждого класса опреде­ляют интервалы значений наблюдаемой величины и называют­ся границами класса. Разница между верхней и нижней грани­цами класса называется размером класса. Классы, не ограни­ченные сверху или снизу, называются открытыми. Классы, ограниченные с двух сторон, называются закрытыми. Довольно часто первый и (или) последний классы частотной таблицы бывают открытыми.

Существует несколько видов частотных таблиц, полезных .для отображения сгруппированных данных. Одним из видов является таблица накопленных частот, получаемая последова­тельным сложением значений частот. Ниже приводится табли­ца накопленных частот для данных о времени ожидания об­служивания посетителями:

Время ожидания меньше, чем, с

Число посетителей (с накоплением)

20

21

40

56

60

98

80

133

100

152

120

162

172

Числа в правом столбце указывают общее число посетите­лей, время ожидания у которых оказалось меньше, чем указан­ная в левом столбце верхняя граница класса. Еще один вид таблиц можно получить, преобразовав частотную таблицу (или таблицу накопленных частот) в таблицу распределения частот путем деления частоты каждого класса (накопленной частоты) на общее число имеющихся в нем элементов данных. Распределения частот полезны, в частности, при сравнении нескольких законов распределений.

С целью улучшения отображения данных частоты и накоп­ленные частоты иногда представляются графически. Наиболее общим графическим представлением является гистограмма, ко­торая отображает в виде прямоугольников частоты классов, причем высота прямоугольников пропорциональна частотам. На рис. 1.2 приведена гистограмма времени ожидания обслу­живания посетителями.

 

 

Особое внимание при построении распределений частот необходимо уделять выбору числа классов и границ интервалов. При этом необходимо, учитывая, конечно, природу данных и цель их использования, следовать некоторым общим рекомен­дациям:

1.           По возможности классы должны иметь одинаковый раз­мер, хотя первый и последний классы при этом могут быть от­крытыми.

2.           Интервалы классов не должны перекрываться. Другими словами, каждый элемент данных должен принадлежать одно­му и только одному классу.

3.           Не следует обычно делать меньше 5 и больше 20 классов.

 

 



<< Предыдущая Оглавление Следующая >>