SortedSet
1. 概要
集合とリストを合わせ持ったようなデータ構造.C++のstd::setに類する
データの追加/削除が行われ,その時点でのデータ集合に対して二分探索を実行したいときに便利.
table: 比較表
set list SoertedSet
存在性チェック O(1) O(N) O(√N)
二分探索 不可 bisectでO(logN) O(√N)
C++が書けるなら,std::setを使った方が良い(insert, find, lower_bound, eraseなどがlog(N)のはずなので,SortedSetよりも高速)
SortedSetはどうしてもC++を使いたくない人用という認識です
と思っていたけど、上のQiitaを読んでみたら意外とSortedsetも良さそう。
2. コード
code: python
import math
from bisect import bisect_left, bisect_right
from typing import Generic, Iterable, Iterator, TypeVar, Optional, List
T = TypeVar('T')
class SortedSet(GenericT): BUCKET_RATIO = 50
REBUILD_RATIO = 170
def _build(self, a=None) -> None:
"Evenly divide a into buckets."
if a is None: a = list(self)
size = self.size = len(a)
bucket_size = int(math.ceil(math.sqrt(size / self.BUCKET_RATIO)))
def __init__(self, a: IterableT = []) -> None: "Make a new SortedSet from iterable. / O(N) if sorted and unique / O(N log N)"
a = list(a)
if not all(ai < ai + 1 for i in range(len(a) - 1)): a = sorted(set(a))
self._build(a)
def __iter__(self) -> IteratorT: for i in self.a:
for j in i: yield j
def __reversed__(self) -> IteratorT: for i in reversed(self.a):
for j in reversed(i): yield j
def __len__(self) -> int:
return self.size
def __repr__(self) -> str:
return "SortedSet" + str(self.a)
def __str__(self) -> str:
s = str(list(self))
def _find_bucket(self, x: T) -> ListT: "Find the bucket which should contain x. self must not be empty."
for a in self.a:
return a
def __contains__(self, x: T) -> bool:
if self.size == 0: return False
a = self._find_bucket(x)
i = bisect_left(a, x)
return i != len(a) and ai == x def add(self, x: T) -> bool:
"Add an element and return True if added. / O(√N)"
if self.size == 0:
self.a = x
self.size = 1
return True
a = self._find_bucket(x)
i = bisect_left(a, x)
if i != len(a) and ai == x: return False a.insert(i, x)
self.size += 1
if len(a) > len(self.a) * self.REBUILD_RATIO:
self._build()
return True
def discard(self, x: T) -> bool:
"Remove an element and return True if removed. / O(√N)"
if self.size == 0: return False
a = self._find_bucket(x)
i = bisect_left(a, x)
if i == len(a) or ai != x: return False a.pop(i)
self.size -= 1
if len(a) == 0: self._build()
return True
def lt(self, x: T) -> OptionalT: "Find the largest element < x, or None if it doesn't exist."
for a in reversed(self.a):
def le(self, x: T) -> OptionalT: "Find the largest element <= x, or None if it doesn't exist."
for a in reversed(self.a):
def gt(self, x: T) -> OptionalT: "Find the smallest element > x, or None if it doesn't exist."
for a in self.a:
def ge(self, x: T) -> OptionalT: "Find the smallest element >= x, or None if it doesn't exist."
for a in self.a:
def __getitem__(self, x: int) -> T:
"Return the x-th element, or IndexError if it doesn't exist."
if x < 0: x += self.size
if x < 0: raise IndexError
for a in self.a:
x -= len(a)
raise IndexError
def index(self, x: T) -> int:
"Count the number of elements < x."
ans = 0
for a in self.a:
return ans + bisect_left(a, x)
ans += len(a)
return ans
def index_right(self, x: T) -> int:
"Count the number of elements <= x."
ans = 0
for a in self.a:
return ans + bisect_right(a, x)
ans += len(a)
return ans
s = SortedSet([])
s.add(50) # 要素の追加.O(√N)
s.add(200)
s.add(150)
s.add(100)
print(len(s)) # 要素数.O(1). -> 4
print(200 in s) # 集合内に存在するか?.O(√N) -> True
s.discard(200) # 要素の削除.O(√N)
print(200 in s) # -> False
print('-' * 10)
print(s.lt(100)) # 引数「より小さい最大」要素.O(√N).存在しなければ None -> 50
print(s.le(100)) # 引数「以下の最大」要素 -> 100
print(s.gt(100)) # 引数「より大きい最小」要素 -> 150
print(s.ge(100)) # 引数「以上の最小」要素 -> 100
print('-' * 10)
print(s.index(120)) # 引数より小さい要素数.O(√N) -> 2
print(s.index(100)) # -> 1
print(s.index_right(100)) # 引数以下の要素数.O(√N) -> 2
print('-' * 10)
print(s1) # 昇順に格納されているので,小さい方からx番目の要素 -> 100 3. 使用例
節タイトルが「8.5 集合の管理(C++のみ)」となっているが,SortedSetを使えばPythonでも楽にAC取れる.
code: python
# SortedSetをここに貼り付け
Q = int(input())
s = SortedSet([])
for _ in range(Q):
op, x = list(map(int, input().split()))
if op == 1:
s.add(x)
elif op == 2:
s.discard(x)
else:
ret = s.ge(x)
if ret is None:
print(-1)
else:
print(ret)