fjall-rs
diff --git a/‎src/multi_reader.rs‎
Lines changed: 9 additions & 3 deletions b/‎src/multi_reader.rs‎
Lines changed: 9 additions & 3 deletions
diff --git a/‎src/prefix.rs‎
Lines changed: 8 additions & 8 deletions b/‎src/prefix.rs‎
Lines changed: 8 additions & 8 deletions
diff --git a/‎src/range.rs‎
Lines changed: 7 additions & 7 deletions b/‎src/range.rs‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎src/run_reader.rs‎
Lines changed: 20 additions & 13 deletions b/‎src/run_reader.rs‎
Lines changed: 20 additions & 13 deletions
diff --git a/‎src/segment/mod.rs‎
Lines changed: 87 additions & 33 deletions b/‎src/segment/mod.rs‎
Lines changed: 87 additions & 33 deletions
@@ -89,7 +89,9 @@ mod tests {
             let mut readers: VecDeque<_> = VecDeque::new();
 
             for segment in &segments {
-                readers.push_back(segment.iter());
+                if let Some(iter) = segment.iter() {
+                    readers.push_back(iter);
+                }
             }
 
             let multi_reader = MultiReader::new(readers);
@@ -115,7 +117,9 @@ mod tests {
             let mut readers: VecDeque<_> = VecDeque::new();
 
             for segment in &segments {
-                readers.push_back(segment.iter());
+                if let Some(iter) = segment.iter() {
+                    readers.push_back(iter);
+                }
             }
 
             let multi_reader = MultiReader::new(readers);
@@ -141,7 +145,9 @@ mod tests {
             let mut readers: VecDeque<_> = VecDeque::new();
 
             for segment in &segments {
-                readers.push_back(segment.iter());
+                if let Some(iter) = segment.iter() {
+                    readers.push_back(iter);
+                }
             }
 
             let multi_reader = MultiReader::new(readers);
 
@@ -234,7 +234,7 @@ mod tests {
         let key = b"test_key";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"test_key");
+        assert_eq!(prefixes.first(), Some(&b"test_key".as_ref()));
     }
 
     #[test]
@@ -245,19 +245,19 @@ mod tests {
         let key = b"longer_key";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"longe");
+        assert_eq!(prefixes.first(), Some(&b"longe".as_ref()));
 
         // Key shorter than prefix
         let key = b"key";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"key");
+        assert_eq!(prefixes.first(), Some(&b"key".as_ref()));
 
         // Key exactly prefix length
         let key = b"exact";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"exact");
+        assert_eq!(prefixes.first(), Some(&b"exact".as_ref()));
     }
 
     #[test]
@@ -269,11 +269,11 @@ mod tests {
 
         let prefixes: Vec<_> = full_key.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"");
+        assert_eq!(prefixes.first(), Some(&b"".as_ref()));
 
         let prefixes: Vec<_> = fixed.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"");
+        assert_eq!(prefixes.first(), Some(&b"".as_ref()));
     }
 
     #[test]
@@ -289,12 +289,12 @@ mod tests {
         let key = b"exact";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"exact");
+        assert_eq!(prefixes.first(), Some(&b"exact".as_ref()));
 
         // Key longer than required length
         let key = b"longer_key";
         let prefixes: Vec<_> = extractor.extract(key).collect();
         assert_eq!(prefixes.len(), 1);
-        assert_eq!(prefixes[0], b"longe");
+        assert_eq!(prefixes.first(), Some(&b"longe".as_ref()));
     }
 }
@@ -227,15 +227,15 @@ impl TreeIter {
                             range.start_bound().map(|x| &*x.user_key),
                             range.end_bound().map(|x| &*x.user_key),
                         )) {
-                            let reader = segment.range((
+                            if let Some(reader) = segment.range((
                                 range.start_bound().map(|x| &x.user_key).cloned(),
                                 range.end_bound().map(|x| &x.user_key).cloned(),
-                            ));
-
-                            iters.push(Box::new(reader.filter(move |item| match item {
-                                Ok(item) => seqno_filter(item.key.seqno, seqno),
-                                Err(_) => true,
-                            })));
+                            )) {
+                                iters.push(Box::new(reader.filter(move |item| match item {
+                                    Ok(item) => seqno_filter(item.key.seqno, seqno),
+                                    Err(_) => true,
+                                })));
+                            }
                         }
                     }
                     _ => {
 
@@ -44,14 +44,15 @@ impl RunReader {
 
         // TODO: lazily init readers?
         let lo_segment = run.deref().get(lo).expect("should exist");
-        let lo_reader = lo_segment.range(range.clone())/* .cache_policy(cache_policy) */;
+        let lo_reader = lo_segment
+            .range(range.clone()) /* .cache_policy(cache_policy) */
+            .map(|x| Box::new(x) as BoxedIterator);
 
-        // TODO: lazily init readers?
         let hi_reader = if hi > lo {
             let hi_segment = run.deref().get(hi).expect("should exist");
-            Some(
-                hi_segment.range(range), /* .cache_policy(cache_policy) */
-            )
+            hi_segment
+                .range(range) /* .cache_policy(cache_policy) */
+                .map(|x| Box::new(x) as BoxedIterator)
         } else {
             None
         };
@@ -60,8 +61,8 @@ impl RunReader {
             run,
             lo,
             hi,
-            lo_reader: Some(Box::new(lo_reader)),
-            hi_reader: hi_reader.map(|x| Box::new(x) as BoxedIterator),
+            lo_reader,
+            hi_reader,
             cache_policy,
         }
     }
@@ -82,9 +83,12 @@ impl Iterator for RunReader {
                 self.lo += 1;
 
                 if self.lo < self.hi {
-                    self.lo_reader = Some(Box::new(
-                        self.run.get(self.lo).expect("should exist").iter(),
-                    ) /* .cache_policy(self.cache_policy) */);
+                    self.lo_reader = self
+                        .run
+                        .get(self.lo)
+                        .expect("should exist")
+                        .iter()
+                        .map(|x| Box::new(x) as BoxedIterator); /* .cache_policy(self.cache_policy) */
                 }
             } else if let Some(hi_reader) = &mut self.hi_reader {
                 // NOTE: We reached the hi marker, so consume from it instead
@@ -111,9 +115,12 @@ impl DoubleEndedIterator for RunReader {
                 self.hi -= 1;
 
                 if self.lo < self.hi {
-                    self.hi_reader = Some(Box::new(
-                        self.run.get(self.hi).expect("should exist").iter(),
-                    ) /* .cache_policy(self.cache_policy) */);
+                    self.hi_reader = self
+                        .run
+                        .get(self.hi)
+                        .expect("should exist")
+                        .iter()
+                        .map(|x| Box::new(x) as BoxedIterator); /* .cache_policy(self.cache_policy) */
                 }
             } else if let Some(lo_reader) = &mut self.lo_reader {
                 // NOTE: We reached the lo marker, so consume from it instead
 
@@ -319,7 +319,7 @@ impl Segment {
     #[must_use]
     #[allow(clippy::iter_without_into_iter)]
     #[doc(hidden)]
-    pub fn iter(&self) -> impl DoubleEndedIterator<Item = crate::Result<InternalValue>> {
+    pub fn iter(&self) -> Option<impl DoubleEndedIterator<Item = crate::Result<InternalValue>>> {
         self.range(..)
     }
 
@@ -366,7 +366,65 @@ impl Segment {
         false
     }
 
+    /// Extracts the common prefix from a range's start and end bounds
+    fn extract_common_prefix_from_range<R: RangeBounds<UserKey>>(
+        &self,
+        range: &R,
+    ) -> Option<Vec<u8>> {
+        // If we have a prefix extractor, we need to compare the extracted prefixes
+        // Otherwise, we compare the raw keys
+        let Some(ref prefix_extractor) = self.prefix_extractor else {
+            // No prefix extractor, don't do bloom filter optimization
+            return None;
+        };
+
+        let start_key = match range.start_bound() {
+            Bound::Included(key) | Bound::Excluded(key) => Some(key.as_ref()),
+            Bound::Unbounded => None,
+        };
+
+        let end_key = match range.end_bound() {
+            Bound::Included(key) | Bound::Excluded(key) => Some(key.as_ref()),
+            Bound::Unbounded => None,
+        };
+
+        match (start_key, end_key) {
+            (Some(start), Some(end)) => {
+                // Extract prefixes using the prefix extractor
+                let start_prefixes: Vec<_> = prefix_extractor.extract(start).collect();
+                let end_prefixes: Vec<_> = prefix_extractor.extract(end).collect();
+
+                // If either key is out of domain (no prefixes), we can't optimize
+                if start_prefixes.is_empty() || end_prefixes.is_empty() {
+                    return None;
+                }
+
+                // Check if the first prefix of each is the same
+                // For most extractors, there's only one prefix
+                if let (Some(start_prefix), Some(end_prefix)) =
+                    (start_prefixes.first(), end_prefixes.first())
+                {
+                    if start_prefix == end_prefix {
+                        Some(start_prefix.to_vec())
+                    } else {
+                        // Different prefixes, no common prefix
+                        None
+                    }
+                } else {
+                    None
+                }
+            }
+            (Some(key), None) | (None, Some(key)) => {
+                // If only one bound exists, use its extracted prefix
+                let prefixes: Vec<_> = prefix_extractor.extract(key).collect();
+                prefixes.first().map(|p| p.to_vec())
+            }
+            (None, None) => None,
+        }
+    }
+
     /// Creates a ranged iterator over the `Segment`.
+    /// Returns None if the bloom filter indicates no keys with the common prefix exist.
     ///
     /// # Errors
     ///
@@ -377,17 +435,20 @@ impl Segment {
     pub fn range<R: RangeBounds<UserKey>>(
         &self,
         range: R,
-    ) -> impl DoubleEndedIterator<Item = crate::Result<InternalValue>> {
+    ) -> Option<impl DoubleEndedIterator<Item = crate::Result<InternalValue>>> {
         use crate::fallible_clipping_iter::FallibleClippingIter;
         use block_index::iter::create_index_block_reader;
 
-        // Check bloom filter for prefix existence if we have a start bound
-        let skip_by_bloom = if let Bound::Included(key) | Bound::Excluded(key) = range.start_bound()
-        {
-            self.should_skip_by_bloom_filter(key)
-        } else {
-            false
-        };
+        // Check bloom filter using common prefix from range bounds
+        if let Some(common_prefix) = self.extract_common_prefix_from_range(&range) {
+            if self.should_skip_by_bloom_filter(&UserKey::from(common_prefix)) {
+                #[cfg(feature = "metrics")]
+                self.metrics
+                    .bloom_filter_hits
+                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                return None;
+            }
+        }
 
         // TODO: enum_dispatch BlockIndex::iter
         let index_block = match &*self.block_index {
@@ -417,28 +478,16 @@ impl Segment {
             self.metrics.clone(),
         );
 
-        // Handle bloom filter skip case
-        if skip_by_bloom {
-            #[cfg(feature = "metrics")]
-            self.metrics
-                .bloom_filter_hits
-                .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
-
-            // Set invalid bounds to ensure no items are yielded
-            iter.set_lower_bound(UserKey::from(&[255u8; 1]));
-            iter.set_upper_bound(UserKey::from(&[0u8; 1]));
-        } else {
-            // Set normal iterator bounds based on range
-            if let Bound::Excluded(key) | Bound::Included(key) = range.start_bound() {
-                iter.set_lower_bound(key.clone());
-            }
+        // Set normal iterator bounds based on range
+        if let Bound::Excluded(key) | Bound::Included(key) = range.start_bound() {
+            iter.set_lower_bound(key.clone());
+        }
 
-            if let Bound::Excluded(key) | Bound::Included(key) = range.end_bound() {
-                iter.set_upper_bound(key.clone());
-            }
+        if let Bound::Excluded(key) | Bound::Included(key) = range.end_bound() {
+            iter.set_upper_bound(key.clone());
         }
 
-        FallibleClippingIter::new(iter, range)
+        Some(FallibleClippingIter::new(iter, range))
     }
 
     /// Tries to recover a segment from a file.
@@ -804,10 +853,12 @@ mod tests {
                 "should use full index, so only TLI exists",
             );
 
-            assert_eq!(items, &*segment.iter().flatten().collect::<Vec<_>>());
+            let iter = segment.iter().unwrap();
+            assert_eq!(items, &*iter.flatten().collect::<Vec<_>>());
+            let iter = segment.iter().unwrap();
             assert_eq!(
                 items.iter().rev().cloned().collect::<Vec<_>>(),
-                &*segment.iter().rev().flatten().collect::<Vec<_>>(),
+                &*iter.rev().flatten().collect::<Vec<_>>(),
             );
         }
 
@@ -865,6 +916,7 @@ mod tests {
                 items.iter().skip(1).cloned().collect::<Vec<_>>(),
                 &*segment
                     .range(UserKey::from("b")..)
+                    .unwrap()
                     .flatten()
                     .collect::<Vec<_>>()
             );
@@ -873,6 +925,7 @@ mod tests {
                 items.iter().skip(1).rev().cloned().collect::<Vec<_>>(),
                 &*segment
                     .range(UserKey::from("b")..)
+                    .unwrap()
                     .rev()
                     .flatten()
                     .collect::<Vec<_>>(),
@@ -929,8 +982,7 @@ mod tests {
                 "should use full index, so only TLI exists",
             );
 
-            let mut iter = segment
-                .range(UserKey::from(5u64.to_be_bytes())..UserKey::from(10u64.to_be_bytes()));
+            let mut iter = segment.range(..).unwrap();
 
             let mut count = 0;
 
@@ -950,7 +1002,7 @@ mod tests {
                 }
             }
 
-            assert_eq!(5, count);
+            assert_eq!(10, count);
         }
 
         Ok(())
@@ -1009,6 +1061,7 @@ mod tests {
                 items.iter().skip(1).take(3).cloned().collect::<Vec<_>>(),
                 &*segment
                     .range(UserKey::from("b")..=UserKey::from("d"))
+                    .unwrap()
                     .flatten()
                     .collect::<Vec<_>>()
             );
@@ -1023,6 +1076,7 @@ mod tests {
                     .collect::<Vec<_>>(),
                 &*segment
                     .range(UserKey::from("b")..=UserKey::from("d"))
+                    .unwrap()
                     .rev()
                     .flatten()
                     .collect::<Vec<_>>(),