Lower RAM implementation of slice_columns for BRWT by hmusta · Pull Request #226 · ratschlab/metagraph

hmusta · 2020-10-26T17:42:17Z

No description provided.

DBGMode used in build_anno_graph

karasikov

What are the results of the benchmarks?

karasikov · 2020-11-13T21:14:49Z

+                                   const ColumnCallback &callback) const {
+    uint64_t nrows = num_rows();
+    sdsl::bit_vector code_column(reduced_matrix_.num_rows());
+    reduced_matrix_.slice_columns(columns, [&](Column j, bitmap&& rows) {


Suggested change

reduced_matrix_.slice_columns(columns, [&](Column j, bitmap&& rows) {

reduced_matrix_.slice_columns(columns, [&](Column j, bitmap&& reduced_column) {

karasikov · 2020-11-13T21:19:00Z

+        rows.add_to(&code_column);
+
+        callback(j, bitmap_generator([&](const auto &index_callback) {
+            for (uint64_t i = 0; i < nrows; ++i) {


This will take forever. Make it parallel

Suggested change

for (uint64_t i = 0; i < nrows; ++i) {

#pragma parallel num_threads(get_num_threads())

for (uint64_t i = 0; i < nrows; ++i) {

karasikov · 2020-11-13T21:19:48Z

+    void slice_columns(const std::vector<Column> &columns,
+                       const ColumnCallback &callback) const override;


Rename to call_columns

karasikov · 2020-11-13T21:21:10Z

+void BRWT::slice_columns(const std::vector<Column> &column_ids,
+                         const ColumnCallback &callback) const {


call_columns

karasikov · 2020-11-13T21:21:36Z

+    if (column_ids.empty())
+        return;
+
+    auto num_nonzero_rows = nonzero_rows_->num_set_bits();


Suggested change

auto num_nonzero_rows = nonzero_rows_->num_set_bits();

uint64_t num_nonzero_rows = nonzero_rows_->num_set_bits();

karasikov · 2020-11-13T21:22:21Z

+    // check if the column is empty
+    if (!num_nonzero_rows)
+        return;


Even if they are empty, you still need to call them. Add unit tests?

karasikov · 2020-11-13T21:23:58Z

+    if (!child_nodes_.size()) {
+        // return the index column
+        for (size_t k = 0; k < column_ids.size(); ++k) {
+            callback(column_ids[k], std::move(*nonzero_rows_->copy()));


Better call a const reference, so the column can be copied by the caller if it's needed, and otherwise, there is no overhead.

Suggested change

callback(column_ids[k], std::move(*nonzero_rows_->copy()));

callback(column_ids[k], *nonzero_rows_);

karasikov · 2020-11-13T21:26:04Z

+        for (size_t k = 0; k < column_ids.size(); ++k) {
+            callback(column_ids[k], std::move(*nonzero_rows_->copy()));


Why not range-based loop?
for (size_t col_id : column_ids) {
...
}

karasikov · 2020-11-13T21:31:06Z

+    tsl::hopscotch_map<uint32_t, std::vector<Column>> child_columns_map;
+    for (size_t i = 0; i < column_ids.size(); ++i) {
+        assert(column_ids[i] < num_columns());
+        auto child_node = assignments_.group(column_ids[i]);
+        auto child_column = assignments_.rank(column_ids[i]);
+
+        auto it = child_columns_map.find(child_node);
+        if (it == child_columns_map.end())
+            it = child_columns_map.emplace(child_node, std::vector<Column>{}).first;
+
+        it.value().push_back(child_column);
+    }
+
+    auto process = [&](auto child_node, auto *child_columns_ptr) {
+        if (num_nonzero_rows == nonzero_rows_->size()) {
+            child_nodes_[child_node]->slice_columns(*child_columns_ptr,
+                [&](Column j, bitmap&& rows) {
+                    callback(assignments_.get(child_node, j), std::move(rows));
+                }
+            );
+        } else {
+            const BRWT *child_node_brwt = dynamic_cast<const BRWT*>(
+                child_nodes_[child_node].get()
+            );
+            if (child_node_brwt
+                    && child_columns_ptr->size() > 1
+                    && !child_node_brwt->child_nodes_.size()) {
+                // if there are multiple column ids corresponding to the same leaf
+                // node, then this branch avoids doing redundant select1 calls
+                const auto *nonzero_rows = child_node_brwt->nonzero_rows_.get();
+                size_t num_nonzero_rows = nonzero_rows->num_set_bits();
+                if (num_nonzero_rows) {
+                    std::vector<uint64_t> set_bits;
+                    set_bits.reserve(num_nonzero_rows);
+                    nonzero_rows->call_ones([&](auto i) {
+                        set_bits.push_back(nonzero_rows->select1(i + 1));
+                    });
+
+                    for (size_t k = 0; k < child_columns_ptr->size() - 1; ++k) {
+                        callback(assignments_.get(child_node, (*child_columns_ptr)[k]),
+                                 bitmap_generator(std::move(set_bits), num_rows()));
+                    }
+
+                    callback(assignments_.get(child_node, child_columns_ptr->back()),
+                             bitmap_generator(std::move(set_bits), num_rows()));
+                }
+            } else {


Could you add some comments to explain why this is going to make things faster than the basic call?

hmusta added 2 commits October 26, 2020 17:29

Differential assembly support for canonical and primary graphs

c9bb0a2

DBGMode used in build_anno_graph

Improved slice_columns in BRWT and Rainbow

420437b

karasikov requested changes Nov 13, 2020

View reviewed changes

Base automatically changed from diff_assembly_canonical to master November 16, 2021 10:03

hmusta marked this pull request as draft November 16, 2021 14:55

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Lower RAM implementation of slice_columns for BRWT#226

Lower RAM implementation of slice_columns for BRWT#226
hmusta wants to merge 2 commits into
masterfrom
slice_columns_brwt

hmusta commented Oct 26, 2020

Uh oh!

karasikov left a comment

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

karasikov Nov 13, 2020

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

	reduced_matrix_.slice_columns(columns, [&](Column j, bitmap&& rows) {
	reduced_matrix_.slice_columns(columns, [&](Column j, bitmap&& reduced_column) {

	for (uint64_t i = 0; i < nrows; ++i) {
	#pragma parallel num_threads(get_num_threads())
	for (uint64_t i = 0; i < nrows; ++i) {

		void slice_columns(const std::vector<Column> &columns,
		const ColumnCallback &callback) const override;

		void BRWT::slice_columns(const std::vector<Column> &column_ids,
		const ColumnCallback &callback) const {

	auto num_nonzero_rows = nonzero_rows_->num_set_bits();
	uint64_t num_nonzero_rows = nonzero_rows_->num_set_bits();

	callback(column_ids[k], std::move(*nonzero_rows_->copy()));
	callback(column_ids[k], *nonzero_rows_);

		for (size_t k = 0; k < column_ids.size(); ++k) {
		callback(column_ids[k], std::move(*nonzero_rows_->copy()));

Uh oh!

Conversation

hmusta commented Oct 26, 2020

Uh oh!

karasikov left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants