Задача #3204

Анализ данных

Уровень ЕГЭ

Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри квадрата со стороной длины H, причём эти квадраты между собой не пересекаются. Стороны квадратов не обязательно параллельны координатным осям. Гарантируется, что такое разбиение существует и единственно для заданных размеров квадратов.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости $A (x_{1}, y_{1})$ и $B (x_{2}, y_{2})$ вычисляется по формуле: $d (A, B) = \sqrt{(x_{2} - x_{1})^{2} + (y_{2} - y_{1})^{2}}$
В файле A хранятся данные о звёздах двух кластеров, где H=8 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
В файле B хранятся данные о звёздах трёх кластеров, где H=6 для каждого кластера. Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звездах в файле B аналогична файлу А.
Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: $P_{x}$ – абсциссу центра кластера с наименьшим числом точек, и $P_{y}$ – ординату центра кластера с наибольшим числом точек.
В ответе запишите четыре числа: в первой строке сначала целую часть произведения $P_{x} \times 10000$ , затем целую часть произведения $P_{y} \times 10000$ для файла А, во второй строке – аналогичные данные для файла B.
Возможные данные одного из файлов иллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию.
Для выполнения задания используйте данные из прилагаемого файла.

Файлы к задаче

Скачать 27_A.txt Скачать 27_B.txt

Новая

Вопрос A

Вопрос B

Введите ответ

Войдите, чтобы история ответов и статистика сохранялись.

Решение Нажми, чтобы открыть Нажми, чтобы скрыть

Ответ

Вопрос A

32865

70666

Вопрос B

144062

61170

data = []
for s in open('27_B.txt'):
    x,y = [float(d) for d in s.split()]
    data.append([x,y])

from math import *

clusters = []
while data:
    cl = [data.pop()]
    for p in cl:
        sosed = [p1 for p1 in data if dist(p,p1)<1]
        for p1 in sosed:
            cl.append(p1)
            data.remove(p1)
    clusters.append(cl)

print([len(cl) for cl in clusters])

def centr(cl):
    m = []
    for p in cl:
        s = sum(dist(p,p1) for p1 in cl)
        m.append([s,p])
    return min(m)[1]

mn = min(clusters, key=len)
mx = max(clusters, key=len)
px = centr(mn)[0]
py = centr(mx)[1]
print(int(px*10000), int(py*10000))

Номер