Задача #3655
Анализ данных
Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.
Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости и вычисляется по формуле:
В файле A хранятся данные о звёздах двух кластеров, где H=6,5, W=4,5 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
В файле B хранятся данные о звёздах трёх кластеров, где H=4,5, W=4 для каждого кластера. Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звездах в файле B аналогична файлу А.
Известно, что в файле A имеются координаты ровно двух, а в файле Б ровно трёх «лишних» точек, являющихся аномалиями, возникшими в результате помех при передаче данных. Эти точки не относятся ни к одному из кластеров, их учитывать не нужно.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: - минимальная абсцисса центра кластера, и - минимальная ордината центра кластера. Для файла Б определите координаты центра каждого кластера, затем найдите два числа: - среднее арифметическое расстояний от центра кластера с минимальным количеством точек до точек этого же кластера, и - среднее арифметическое расстояний от центра кластера с максимальным количеством точек до точек этого же кластера. Нулевое расстояние от центра кластера до самого себя не учитывать.
В ответе запишите четыре числа: в первой строке - сначала целую часть абсолютной величины произведения × 10000, затем целую часть абсолютной величины произведения × 10 000; во второй строке - начала целую часть абсолютной величины произведения × 10000, затем целую часть абсолютной величины произведения × 10 000.
Возможные данные одного из файлов иллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию.
Для выполнения задания используйте данные из прилагаемого файла. 